最新发布第15页
鸢尾花种类预测—流程实现-白鸢的笔记

鸢尾花种类预测—流程实现

1 再识K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm='auto')n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数algorithm:{‘auto’,‘ba...
特征工程-特征预处理-白鸢的笔记

特征工程-特征预处理

1 什么是特征预处理1.1 特征预处理定义scikit-learn的解释provides several common utility functions and transformer classes to change raw feature vectors into a representation that is ...
zhyann的头像-白鸢的笔记钻石会员zhyann1年前
04911
案例:鸢尾花种类预测--数据集介绍-白鸢的笔记

案例:鸢尾花种类预测–数据集介绍

本实验介绍了使用Python进行机器学习的一些基本概念。 在本案例中,将使用K-Nearest Neighbor(KNN)算法对鸢尾花的种类进行分类,并测量花的特征。本案例目的:遵循并理解完整的机器学习过程对...
zhyann的头像-白鸢的笔记钻石会员zhyann1年前
09815
kd树-白鸢的笔记

kd树

问题导入实现k近邻算法时,主要考虑的问题是如何对训练数据进行快速k近邻搜索。这在特征空间的维数大及训练数据容量大时尤其必要。k近邻法最简单的实现是线性扫描(穷举搜索),即要计算输入实...
k值的选择-白鸢的笔记

k值的选择

K值选择说明K值过小:容易受到异常点的影响k值过大:受到样本均衡的问题 用这个例子来看from sklearn.neighbors import KNeighborsClassifier x = [[0], [1], [2], [3]] y = [0, 0, 1, 1] esti...
距离度量-白鸢的笔记

距离度量

1 欧式距离(Euclidean Distance):欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。X=[[1,1],[2,2],[3,3],[4,4]]; 经计算得:d ...
k近邻算法api初步使用-白鸢的笔记

k近邻算法api初步使用

机器学习流程1.获取数据集2.数据基本处理3.特征工程4.机器学习5.模型评估 Scikit-learn工具介绍Python语言的机器学习工具Scikit-learn包括许多知名的机器学习算法的实现Scikit-learn文档完善,...
K-近邻算法简介-白鸢的笔记

K-近邻算法简介

1 什么是K-近邻算法根据你的“邻居”来推断出你的类别 1.1 K-近邻算法(KNN)概念K Nearest Neighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法, 总体来说KNN算法是相对比较容...
zhyann的头像-白鸢的笔记钻石会员zhyann1年前
06811
电影案例分析-白鸢的笔记

电影案例分析

2.1 问题一:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取?得出评分的平均分 2.2 问题二:对于这一组电影数据,如果我们想Rating,Runtime (Minutes)的分布情...
分组聚合-白鸢的笔记

分组聚合

分组与聚合 1. 分组APIDataFrame.groupby(key, as_index=False)key:分组的列数据,可以多个案例:不同颜色的不同笔的价格数据 col =pd.DataFrame({'color': ['white','red','green','red','gre...