当前位置: 首页 > news >正文

做网站需要注意的点服装公司网站策划书

做网站需要注意的点,服装公司网站策划书,专业手机网站定制,html网站两边的浮窗怎么做大家好#xff0c;我是微学AI#xff0c;今天给大家介绍一下人工智能算法工程师(中级)课程6-sklearn机器学习之聚类问题与代码详解。在机器学习领域#xff0c;聚类是一种无监督学习方法#xff0c;旨在将相似的数据点划分为同一类别。sklearn是一个广泛应用于机器学习的Py…大家好我是微学AI今天给大家介绍一下人工智能算法工程师(中级)课程6-sklearn机器学习之聚类问题与代码详解。在机器学习领域聚类是一种无监督学习方法旨在将相似的数据点划分为同一类别。sklearn是一个广泛应用于机器学习的Python库提供了多种聚类算法。本文将详细介绍K-Means、DBSCAN和层次聚类这三种算法的数学原理、公式及实现代码。 文章目录 sklearn机器学习之聚类问题与代码详解1.K-Means算法K-Means的数学原理K-Means的公式K-Means算法代码实现 2.DBSCAN算法DBSCAN算法数学原理DBSCAN算法公式DBSCAN算法代码实现 3.层次聚类层次聚类数学原理层次聚类公式层次聚类代码实现 总结 sklearn机器学习之聚类问题与代码详解 1.K-Means算法 K-Means的数学原理 K-Means算法是一种基于距离的聚类方法。其目标是将数据集划分为K个簇使得每个数据点与其所属簇的中心点距离最小。 K-Means算法过程如下 -初始化随机选择K个数据点作为初始聚类中心。 -分配步骤对于数据集中的每一个数据点计算它与每个聚类中心的距离并将其分配到最近的聚类中心所代表的簇中。 -更新步骤重新计算每个簇的中心点。新的聚类中心是该簇所有数据点的均值即取簇内所有点的坐标的平均值。 -迭代重复步骤2和步骤3直到满足停止条件。停止条件可以是聚类中心的变化小于某个阈值、达到预设的迭代次数或者数据点的簇分配不再改变。 -结束当聚类中心的变化小于预设的阈值或达到最大迭代次数时算法停止迭代此时的聚类中心即为最终结果。 K-Means的公式 设数据集为X聚类中心为C则K-Means算法的目标函数为 J ∑ i 1 K ∑ x ∈ S i ∣ ∣ x − c i ∣ ∣ 2 J \sum_{i1}^{K} \sum_{x \in S_i} ||x - c_i||^2 Ji1∑K​x∈Si​∑​∣∣x−ci​∣∣2 其中 S i S_i Si​表示第i个簇 c i c_i ci​表示第i个簇的中心点。 K-Means算法代码实现 from sklearn.cluster import KMeans import numpy as np # 生成数据 X np.random.rand(100, 2) # 初始化KMeans kmeans KMeans(n_clusters3) # 拟合数据 kmeans.fit(X) # 预测结果 labels kmeans.predict(X) # 输出聚类中心 print(聚类中心, kmeans.cluster_centers_)2.DBSCAN算法 DBSCAN算法数学原理 DBSCANDensity-Based Spatial Clustering of Applications with Noise是一种基于密度的聚类算法。它将具有足够高密度的区域划分为簇并可以发现任意形状的簇。 DBSCAN算法公式 DBSCAN算法涉及以下两个参数 ε邻域半径判断一个点是否为核心点的邻域半径MinPts最小样本数判断一个核心点是否为边界点的最小样本数 一个点p的密度可达点定义为从p出发通过密度相连的点可以到达的所有点。 DBSCAN算法的过程如下 1.参数选择首先需要选择两个参数 εepsilon邻域半径表示一个点的邻域大小。MinPts最小样本数表示一个区域内至少需要多少个点才能被视为密度可达。 2.核心点识别对于数据集中的每个点计算以该点为中心、半径为ε的邻域内的点的数量。如果这个数量大于或等于MinPts则该点被称为核心点。 3.密度直达如果一个点p在另一个核心点q的ε邻域内那么点p由点q密度直达。 4.密度可达如果一个点p由核心点q密度直达核心点q由核心点r密度直达以此类推形成一条链那么点p由点r密度可达即使点p不在点r的ε邻域内。 5.簇的形成从数据集中任意选择一个未访问过的核心点开始找出所有从这个点密度可达的核心点这些点组成一个簇。重复这个过程直到所有核心点都被访问过。 6.噪声点的识别所有不是核心点且不与任何核心点密度可达的点被认为是噪声点。 DBSCAN算法代码实现 from sklearn.cluster import DBSCAN import numpy as np # 生成数据 X np.random.rand(100, 2) # 初始化DBSCAN dbscan DBSCAN(eps0.3, min_samples5) # 拟合数据 dbscan.fit(X) # 预测结果 labels dbscan.labels_ # 输出聚类结果 print(聚类结果, labels)3.层次聚类 层次聚类数学原理 层次聚类Hierarchical Clustering是一种逐步合并或分裂的聚类方法。它分为自底向上凝聚和自顶向下分裂两种策略。 层次聚类公式 层次聚类的相似度计算方法有多种如最小距离、最大距离和平均距离等。以下是最小距离的计算公式 d m i n ( C i , C j ) min ⁡ x ∈ C i , y ∈ C j ∣ ∣ x − y ∣ ∣ d_{min}(C_i, C_j) \min_{x \in C_i, y \in C_j} ||x - y|| dmin​(Ci​,Cj​)x∈Ci​,y∈Cj​min​∣∣x−y∣∣ 层次聚类代码实现 from sklearn.cluster import AgglomerativeClustering import numpy as np # 生成数据 X np.random.rand(100, 2) # 初始化层次聚类 agg_clustering AgglomerativeClustering(n_clusters3, linkageward) # 拟合数据 agg_clustering.fit(X) # 预测结果 labels agg_clustering.labels_ # 输出聚类结果 print(聚类结果, labels)总结 本篇文章详细介绍了sklearn中三种常见的聚类算法K-Means、DBSCAN和层次聚类。通过数学原理、公式及代码实现帮助读者更好地理解和应用这些算法。在实际应用中根据数据特点选择合适的聚类算法至关重要。希望本文对您有所帮助
http://www.hkea.cn/news/14388848/

相关文章:

  • 久久seo综合查询seo怎么优化步骤
  • 专门做定制的网站软件开发文档管理系统
  • 在柬埔寨做网络销售推网站连云港做网站公司
  • 郑州数码网站建设服务公司网站开发生命周期
  • 百度推广网站必须备案吗自己做网站的难度
  • 主备网站服务器自动切换 win2003建站之星7大核心价值
  • 做网站 贴吧网站制作的相关术语
  • 全球最大购物网站山东网站备案注销
  • wordpress自动过滤html标签seo关键词快速获得排名
  • 服装业网站建设的策划企业设计网站系统
  • 旅游公司网站开发与实现如何利用微信进行企业网站推广
  • 珠宝网站设计文案沈阳网站制作方法
  • 张店网站优化推广网站建设实训结论与分析总结
  • 南城区网站建设公司浙江省建筑考证服务平台
  • 网站建设公司济南ysl网站设计论文
  • 移动端网站开发项目邮箱域名是什么
  • 用php如何建设网站好看的网站颜色
  • 萍乡企业网站建设个人备案网站经营
  • 如何迅速k掉网站头条网站开发
  • 2017免费网站空间做商品网站的教学视频
  • 设计网站开发新网页游戏网游
  • 创建个人网站教案一级做ae视频直播可以吗多少钱
  • 网站建设的目的与意义是什么轻松筹 做的网站价格
  • 什么是网站抄袭健身网站设计模板下载
  • 将网站源码下载下来如何使用影响关键词优化的因素
  • 宁波网站建设多少钱php 怎么做 网站吗
  • 贵州省交通工程建设质监局网站网站空间怎么查询
  • 网站制作一年多少钱南昌网站设计哪家专业好
  • 小企业公司网站建设淘宝详情页设计模板
  • 50强网站建设公司企业网站的常见服务