当前位置: 首页 > news >正文

给人做网站的公司临沂做网站选盛誉

给人做网站的公司,临沂做网站选盛誉,档案网站建设思考,做网站需要多少钱 做1.原理 决策树#xff08;Decision Tree#xff09;#xff0c;它是一种以树形数据结构来展示决策规则和分类结果的模型#xff0c;作为一种归纳学习算法#xff0c;其重点是将看似无序、杂乱的已知数据#xff0c;通过某种技术手段将它们转化成可以预测未知数据的树状模…1.原理 决策树Decision Tree它是一种以树形数据结构来展示决策规则和分类结果的模型作为一种归纳学习算法其重点是将看似无序、杂乱的已知数据通过某种技术手段将它们转化成可以预测未知数据的树状模型每一条从根结点对最终分类结果贡献最大的属性到叶子结点最终分类结果的路径都代表一条决策的规则。 一般一棵决策树包含一个根节点若干个内部结点和若干个叶结点。 叶结点对应于决策结果其他每个结点对应于一个属性测试。每个结点包含的样本集合根据属性测试的结果划分到子结点中根结点包含样本全集从根结点到每个叶结点的路径对应了一个判定的测试序列。决策树学习的目的是产生一棵泛化能力强即处理未见示例强的决策树。 使用决策树进行决策的过程就是从根节点开始测试待分类项中相应的特征属性并按照其值选择输出分支直到到达叶子节点将叶子节点存放的类别作为决策结果。 1.步骤 至于如何生成决策树具体步骤如下图: 上图就是在生成决策树的过程中经历的步骤。详细步骤如下 (1).首先从开始位置将所有数据划分到一个节点即根节点。 (2).然后经历橙色的两个步骤橙色的表示判断条件 若数据为空集跳出循环。如果该节点是根节点返回null如果该节点是中间节点将该节点标记为训练数据中类别最多的类 若样本都属于同一类跳出循环节点标记为该类别 (3).如果经过橙色标记的判断条件都没有跳出循环则考虑对该节点进行划分。既然是算法则不能随意的进行划分要讲究效率和精度选择当前条件下的最优属性划分什么是最优属性这是决策树的重点后面会详细解释 (4).经历上步骤划分后生成新的节点然后循环判断条件不断生成新的分支节点直到所有节点都跳出循环。 (5).结束。这样便会生成一棵决策树。 2.划分选择 了解了其步骤后便明白了其关键便是如何寻找最优属性其选择方法一般有三种。 (1).信息增益 通过方程 Gain ⁡ ( D , a ) Ent ⁡ ( D ) − ∑ v 1 V ∣ D v ∣ ∣ D ∣ Ent ⁡ ( D v ) \operatorname{Gain}(D,a)\mathrm{}\operatorname{Ent}(D)-\sum_{v1}^{V}\frac{|D^{v}|}{|D|}\operatorname{Ent}(D^{v}) Gain(D,a)Ent(D)−v1∑V​∣D∣∣Dv∣​Ent(Dv) 来计算每个属性的信息增益最优属性即为信息增益最大的属性。 E n t ( D ) − ∑ k 1 ∣ γ ∣ p k log ⁡ 2 p k \begin{aligned}\mathrm{Ent}(D)-\sum_{k1}^{|\gamma|}p_k\log_2p_k\end{aligned} Ent(D)​−k1∑∣γ∣​pk​log2​pk​​ Ent(D)即为样本D的信息熵由该公式计算可得。 (2).信息增益率 信息增益准则对可取值数目较多的属性有所偏好增益率定义如下 G a i n _ r a t i o ( D , a ) G a i n ( D , a ) I V ( a ) \mathrm{Gain\_ratio}(D,a)\frac{\mathrm{Gain}(D,a)}{\mathrm{IV}(a)} Gain_ratio(D,a)IV(a)Gain(D,a)​ 其中 I V ( a ) − ∑ v 1 V ∣ D v ∣ ∣ D ∣ log ⁡ 2 ∣ D v ∣ ∣ D ∣ \begin{aligned}\mathrm{IV}(a)-\sum_{v1}^V\frac{|D^v|}{|D|}\log_2\frac{|D^v|}{|D|}\end{aligned} IV(a)​−v1∑V​∣D∣∣Dv∣​log2​∣D∣∣Dv∣​​称为属性a的固有值。该划分算法先从候选划分属性中找出信息增益高于平均水平的属性再从中选择增益率最高的属性。 (3).基尼指数 数据D的纯度可用基尼值来度量即用如下公式来计算 G i n i ( D ) ∑ k 1 ∣ γ ∣ ∑ k ′ ≠ k p k p k ′ 1 − ∑ k 1 ∣ γ ∣ p k 2 \mathrm{Gini}(D){\sum_{k1}^{|\gamma|}\sum_{k^{\prime}\neq k}p_kp_{k^{\prime}}1-\sum_{k1}^{|\gamma|}p_k^2} Gini(D)k1∑∣γ∣​k′k∑​pk​pk′​1−k1∑∣γ∣​pk2​ Gini(D)反映了从数据集D中随机抽取两个样本其类别标记不一致的概率Gini(D)越小表示数据集D的纯度越高。而属性a的基尼指数则是根据这个公式推广而得具体形式如下 G i n i _ i n d e x ( D , a ) ∑ v 1 V ∣ D v ∣ ∣ D ∣ G i n i ( D v ) \mathrm{Gini\_index}(D,a)\sum_{v1}^{V}\frac{|D^{v}|}{|D|}\mathrm{Gini}(D^{v}) Gini_index(D,a)v1∑V​∣D∣∣Dv∣​Gini(Dv) 。在候选属性集合A中选择那个使得划分后基尼指数最小的属性作为最优划分属性。 3.剪枝 剪枝顾名思义就是给决策树 “去掉” 一些判断分支同时在剩下的树结构下仍然能得到不错的结果。之所以进行剪枝是为了防止或减少 “过拟合现象” 的发生是决策树具有更好的泛化能力。 剪枝主要分为两种方法其一是预剪枝即在决策树构造时就进行剪枝。在决策树构造过程中对节点进行评估如果对其划分并不能再验证集中提高准确性那么该节点就不要继续王下划分。这时就会把当前节点作为叶节点。其二是后剪枝即在生成决策树之后再剪枝。通常会从决策树的叶节点开始逐层向上对每个节点进行评估。如果剪掉该节点带来的验证集中准确性差别不大或有明显提升则可以对它进行剪枝用叶子节点来代填该节点。 2.代码 在scikit-learn中你可以通过设置DecisionTreeClassifier的参数来进行决策树的剪枝以防止过拟合。以下是一些常用的参数 max_depth决策树的最大深度。这可以防止树过于复杂导致过拟合。 min_samples_split分割内部节点所需的最少样本数。如果一个节点的样本数少于这个值那么这个节点就不会被分割。 min_samples_leaf在叶节点处需要的最小样本数。这可以防止创建样本数过少的叶节点。 max_leaf_nodes最大叶节点数量。这是另一种控制树大小的方法。 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier# 加载鸢尾花数据集 iris load_iris() X iris.data y iris.target# 划分训练集和测试集 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42)# 创建决策树分类器并设置剪枝参数 clf DecisionTreeClassifier(max_depth3, min_samples_split10, min_samples_leaf5, max_leaf_nodes10)# 训练模型 clf.fit(X_train, y_train)# 预测测试集 y_pred clf.predict(X_test)# 打印预测结果 print(y_pred)
http://www.hkea.cn/news/14340122/

相关文章:

  • 高清免费爱做网站企业管理咨询是干什么的
  • 易企互联网站建设公司主页怎么写
  • wordpress导出excel秦皇岛做网站优化价格
  • 怎么自己制作网站免费网站建设有关书籍
  • 郑州网站建设联系方式成都网站建设 培训学校
  • 广州佛山建立网站的公司怎么说服企业做网站
  • 网站模板加盟代理苏州网站建设案例
  • 霞浦网站建设怎么注册网站账号
  • 如何更改网站内链中国建设资格注册中心网站
  • 天津南开做网站做音频后期的素材网站
  • 网站建设作廉洁沈阳网站
  • 施工方案下载免费网站成都品牌设计策划
  • 手机网站做多宽家居网站建设咨询
  • 北京做彩右影影视公司网站微网站建设哪家优惠
  • 做团餐 承包食堂的企业网站公众号开发者多次群发
  • 影视网站建设方案网站开发沟通
  • 中英文网站建站杭州网站建设哪家强
  • 佛山营销网站建设服务怎么做属于自己的网站
  • 个人网站建设的论文网站形象首页flash
  • 做网站需要会写代码吗南昌seo网站推广
  • 怎么建设网站百度搜索的到儿童编程培训机构
  • 想建书画网站怎么做的创建个人网站怎么做
  • 网站搜索引擎拓客做图片的软件
  • 微擎怎么做网站文库网站开发建设
  • 手绘风格 网站thinkphp网站开发实战教程
  • 柯城建设局网站海安市建设局网站
  • 沈阳网站建设哪家便宜中国著名外贸公司有哪些
  • 湖北网站建设 鄂 icpWordpress外贸网站搭建公司
  • 专业集团门户网站建设企业培训公司
  • 做网站片头的软件网片