当前位置: 首页 > news >正文

网站优化效果企业文化学习心得

网站优化效果,企业文化学习心得,a最先基智网站建设,网站设计建设 公司1.理论知识 KNN#xff08;K-Nearest Neighbor#xff09;算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类#xff0c;也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。 KNN算法的思想#xff1a; 对于任意n维输入向量#xff0c;分别对应于特征…1.理论知识 KNNK-Nearest Neighbor算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。 KNN算法的思想 对于任意n维输入向量分别对应于特征空间中的一个点输出为该特征向量所对应的类别标签或预测值。 KNN算法是一种非常特别的机器学习算法因为它没有一般意义上的学习过程。它的工作原理是利用训练数据对特征向量空间进行划分并将划分结果作为最终算法模型。存在一个样本数据集合也称作训练样本集并且样本集中的每个数据都存在标签即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的数据后将这个没有标签的数据的每个特征与样本集中的数据对应的特征进行比较然后提取样本中特征最相近的数据最近邻的分类标签。 图2.1 KNN算法示意图 其中常用的距离量度方式包括 闵可夫斯基距离欧氏距离曼哈顿距离切比雪夫距离余弦距离 2.算法流程图 3.关键代码 from numpy import * import operator# k近邻分类算法 def classify0(inX, dataSet, labels, k):# 欧式距离计算dataSetSize dataSet.shape[0]diffMat tile(inX, (dataSetSize, 1)) - dataSetsqDiffMat diffMat ** 2sqDistinces sqDiffMat.sum(axis1) # 行方向求和distances sqDistinces ** 0.5# 将距离值进行排序并返回索引值sortedDistIndicies distances.argsort()# 选择距离最小的k个点并统计k个点中各个类别的数目classCount {}for i in range(k):voteIlabel labels[sortedDistIndicies[i]]classCount[voteIlabel] classCount.get(voteIlabel, 0) 1# 排序选择类别数目最多的所属类别sortedClassCount sorted(classCount.items(), keyoperator.itemgetter(1), reverseTrue)return sortedClassCount[0][0]# 归一化数值 def autoNorm(dataSet):minVals dataSet.min(0)maxVals dataSet.max(0)ranges maxVals - minValsnormDataSet zeros(shape(dataSet))m dataSet.shape[0] # 获取数据行数normDataSet dataSet - tile(minVals, (m, 1))normDataSet normDataSet / tile(ranges, (m, 1))return normDataSet, ranges, minValsif __name__ __main__:dataSet [[3, 104], [2, 100], [1, 81], [101, 10], [99, 5], [98, 2]] labels [类别1, 类别1, 类别1, 类别2, 类别2, 类别2] test [100, 90] # 未知电影的接吻镜头次数、打斗镜头次数 normMat, ranges, minVals autoNorm(array(dataSet)) # 归一化处理 k 3 classifierResult classify0(test, normMat, labels, k) print(输入的k:\n , k) print(------------------------------------------------------) print(数据为:\n , dataSet) print(------------------------------------------------------) print(对应标签为:\n , labels) print(------------------------------------------------------) print(输入数据为:\n , test) print(------------------------------------------------------) print(预测的标签\n, classifierResult)4.实验结果 测试数据 表2.1 输入的数据集(输入k3) 数据 3, 104 2, 100 1, 81 101, 10 99, 5 98, 2 类别 类别1 类别1 类别1 类别2 类别2 类别2 *其中3,104代表属性1为3, 属性2为104. 实验结果与分析 图2.2 实验结果 算法特点 优点 简单易用。相比其他算法KNN 算法比较简洁明。模型训练时间快上面说到 KNN 算法是惰性的。预测效果好。对异常值不敏感。 缺点 对内存要求较高因为该算法存储了所有训练数据。预测阶段可能很慢。对不相关的功能和数据规模敏感。 其他实验我是芒果酱点一个关注吧(σ′▽‵)′▽‵)σ k-Means聚类算法 HNUST【数据分析技术】(2024)-CSDN博客PageRank Web页面分级算法 HNUST【数据分析技术】(2024)-CSDN博客KNN分类算法 HNUST【数据分析技术】(2024)-CSDN博客Apriori关联规则算法 HNUST【数据分析技术】(2024)-CSDN博客
http://www.hkea.cn/news/14260394/

相关文章:

  • 自由做图网站长春市建设技工学校网站
  • 注册网站对接的短信平台有哪些可以做网站的平台
  • 网站落地页是什么意思网件路由器重置
  • 河南 网站备案中国在线商城注册管理平台
  • 多域名网站大数据在营销中的应用案例
  • 建设项目验收网站天津手机版建站系统价格
  • 菏泽网站建设做一晚水泥工歌曲网站
  • 上海网站建设中小型企业公司网站备案名称
  • 高性能网站建设进阶指南北京外包seo公司
  • 网站底部备案图标做网站需要后台吗
  • 宠物用品技术支持 东莞网站建设凡建网站
  • 国外做论坛网站网站建设意义
  • 网站做接口需要哪些茶网站开发方案
  • 免费网站入口2021牡丹江做网站
  • 商业网站制作教程开发网站需要多少资金
  • 花万元请人做网站旅游网页设计模板源代码
  • 建设营销网站要什么百度软件开放平台
  • 上海网站关键词高端定制品牌
  • 怎么让网站被百度搜到网站备案周期
  • 医院网站需要前置审批柳州企业网站开发平台
  • 小学学校网站网站备案更改需要多久
  • 杭州市做网站深圳商城软件开发
  • 网站推广服务chuseo四川成都百度推广
  • 网站空间查询中企动力做的网站后台如何登陆
  • 网站建设就业前景软件工程公司有哪些
  • 北京远程时代网站建设曲靖企业网站
  • 广告公司网站制作想建书画网站怎么做的
  • 外网门户网站建设方案网站开发实用技术第二版答案
  • 网站建设工作半年通报室内设计有哪些网站
  • 盘锦市网站建设企业网站网站建设价格