最新发布第15页
排序
鸢尾花种类预测—流程实现
1 再识K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto')n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数algorithm:{‘auto’,‘ba...
特征工程-特征预处理
1 什么是特征预处理1.1 特征预处理定义scikit-learn的解释provides several common utility functions and transformer classes to change raw feature vectors into a representation that is ...
案例:鸢尾花种类预测–数据集介绍
本实验介绍了使用Python进行机器学习的一些基本概念。 在本案例中,将使用K-Nearest Neighbor(KNN)算法对鸢尾花的种类进行分类,并测量花的特征。本案例目的:遵循并理解完整的机器学习过程对...
k值的选择
K值选择说明K值过小:容易受到异常点的影响k值过大:受到样本均衡的问题 用这个例子来看from sklearn.neighbors import KNeighborsClassifier x = [[0], [1], [2], [3]] y = [0, 0, 1, 1] esti...
距离度量
1 欧式距离(Euclidean Distance):欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。X=[[1,1],[2,2],[3,3],[4,4]]; 经计算得:d ...
k近邻算法api初步使用
机器学习流程1.获取数据集2.数据基本处理3.特征工程4.机器学习5.模型评估 Scikit-learn工具介绍Python语言的机器学习工具Scikit-learn包括许多知名的机器学习算法的实现Scikit-learn文档完善,...
K-近邻算法简介
1 什么是K-近邻算法根据你的“邻居”来推断出你的类别 1.1 K-近邻算法(KNN)概念K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容...
电影案例分析
2.1 问题一:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取?得出评分的平均分 2.2 问题二:对于这一组电影数据,如果我们想Rating,Runtime (Minutes)的分布情...
分组聚合
分组与聚合 1. 分组APIDataFrame.groupby(key, as_index=False)key:分组的列数据,可以多个案例:不同颜色的不同笔的价格数据 col =pd.DataFrame({'color': ['white','red','green','red','gre...