当前位置: 首页 > news >正文

东莞网站建设哪家好深圳建设网站哪家强

东莞网站建设哪家好,深圳建设网站哪家强,老网站权重低的原因,模板做的网站如何下载由 AI 生成#xff1a;过度简化的树、引导聚合、集成方法、弱学习器、减少方差 集成方法 — 数量#xff0c;而不是质量 一、说明 机器学习中的集成方法是指组合多个模型以提高预测性能的技术。集成方法背后的基本思想是聚合多个基础模型#xff08;通常称为弱学习器#… 由 AI 生成过度简化的树、引导聚合、集成方法、弱学习器、减少方差 集成方法 — 数量而不是质量 一、说明 机器学习中的集成方法是指组合多个模型以提高预测性能的技术。集成方法背后的基本思想是聚合多个基础模型通常称为弱学习器的预测以生成通常比任何单个模型更准确、更稳健的最终预测。一般而言我们通常遵循质量胜于数量的原则。然而在这种情况下事实证明相反的原理同样有效。 二、何为集成方法 集成方法通常分为两类 Bagging 这种方法涉及在训练数据的不同子集上训练同一基础学习算法的多个实例。集成中的每个模型都独立学习然后通常通过平均或投票来组合它们的预测以做出最终预测。提升 提升的工作原理是按顺序训练一系列较弱的学习器其中每个后续模型都侧重于前一个模型难以处理的示例。最终预测通常是每个弱学习器所做预测的加权总和。 常见的集成方法包括 Random Forest、AdaBoost、Gradient Boosting Machines 或 Extreme Gradient Boosting。这些方法由于能够提高预测准确性和泛化性能而广泛用于各种机器学习任务。 在本文中我们将仔细研究第一种方法即 bagging。 三、什么是装袋— 简短介绍 装袋 Bootstrap aggregating 是机器学习中的一种技术在这种技术中我们创建模型的多个副本并在训练数据的不同子集上训练每个副本。这些子集是通过随机选择带有替换的样本来创建的这就是 “bootstrap” 部分的用武之地。训练每个模型后它们的预测以某种方式组合起来以做出最终预测。 Bagging 通过对多个模型进行平均或投票来帮助减少预测的方差与单独使用单个模型相比可以获得更稳定、更准确的预测。 想象一下您正在尝试猜测罐子中的糖果数量。如果你只问一个朋友猜他们可能会差很多。但是如果你问几个朋友每个朋友都有不同的观点和猜测方式然后你平均他们的猜测你可能会得到一个更准确的估计。 四、如何减少方差 正如我们之前提到的装袋是一种减少方差的方法。它基于一个简单的观察。         假设我们有 n 个独立随机变量 X1,...,Xn具有相同的方差 σ^2。这些变量中的每一个都对应于每个弱学习器的预测。如果我们对所有较弱的学习器的结果进行平均会怎么样 设 X ― 是所有弱学习器的平均值。让我们看看这样一个随机变量的方差将如何变化。 所以我们想找到 我们来做一些计算。根据方差的属性 由于变量 习 是独立的我们可以写成 但是所有随机变量 X1,...,Xn 具有相同的方差 σ^2因此 因此 对一组观测值求平均值可以减少方差。因此减少方差从而提高给定学习方法的预测准确性的自然方法是从总体中提取多个训练集使用每个训练集构建单独的预测模型然后对结果预测进行平均。 五、装袋如何运作 简而言之我们使用 K 个不同的训练集 S1,...,Sk 构建 K 模型 f1,...,fk。每个模型 fi 都在不同的 si 集上训练。然后我们将所有 K 模型获得的结果平均以获得具有低方差的单个统计模型 不幸的是在实践中通常很难获得这么多不同的训练集。我们经常为数据太少的问题而苦苦挣扎。在这种情况下我们该怎么办正如您可能已经猜到的那样“bootstrap 聚合”这个名称揭示了我们如何处理获取不同训练数据集的问题 — 执行 bootstrap 采样。 Bootstrap 抽样只不过是带替换的随机抽样。 带替换的随机抽样是从数据集中随机选择项目的过程每次选择后该项目都会放回数据集中。这意味着在抽样过程中可以多次选择同一项目。 因此在 bagging 方法中或者更准确地说是 bootstrap 聚合我们使用 k 个 bootstrap 样本构建 k 个模型然后我们对所有模型获得的结果进行平均以获得单个预测。 六、副作用 — “Out of Bag” 集 事实证明在引导过程中平均只有大约 2/3 的观察值用于构建树。在树构建期间未使用的观测值称为 OOB 外 OOB 观测值。 因此如果我们执行 bootstrap K 次那么对于平均 K/3 个观测值树没有使用该观测值。我们可以使用这些树来估计预测误差方法是取这些树的平均误差。OOB 估计的总误差作为所有观测值的平均误差是检验误差的良好近似值。 为什么 1/3 的观察结果没有用于树木构建过程 假设我们有 n 个观测值。然后不选择单个观测值的概率相等 如果我们用替换 n 次来绘制它们那么概率为 限制中的内容或实际上对于大 n给出了大约 七、示例 让我们从生成人工数据集开始。 数据是一维的表示由方程 yxsinx 描述的区间 [0,10] 上的函数其中添加了一些随机噪声。 首先我们需要确定我们想要构建多少个估计器模型即我们需要指定数字 K。假设 K3。         现在我们将演示 bootstrap 的工作原理。         在 bootstrap 中目标是使用替换对观测值进行随机采样。在我们的例子中我们为每个模型分别绘制了三次训练样本。         由于我们正在使用替换进行绘制因此某些观测值可能根本不会绘制而其他观测值可能会绘制多次。黄色越强烈绘制给定观测值的次数就越多。 现在我们为每个样本分别训练一个单独的估计器在我们的例子中它是一个决策树。这样我们将获得三种回归树模型。         我们将将它们全部显示在一个图上以便更好地可视化它们之间的差异。 通过聚合结果即从所有 3 棵树中获取平均预测值我们得到最终模型。 例如让我们看看基于不同 bootstrap 样本构建的每棵树对值 x8 的预测 Tree 0 4.54997803 Tree 1 5.64685022 Tree 2 5.79985777 最终模型只是各个分量结果的平均值因此 八、实现 幸运的是我们不必手动完成所有这些操作。我们得到了流行的 sklearn 模块中的实现的帮助。         我们只需要选择估计器 — 在我们的例子中它是一个回归树以及这些估计器的数量这些估计器是我们想要构建的模型然后对它们的结果进行平均。 from sklearn.ensemble import BaggingRegressor from sklearn.tree import DecisionTreeRegressorbagged_trees BaggingRegressor(base_estimatorDecisionTreeRegressor(max_depth3),n_estimators3,) bagged_trees.fit(data_train, target_train) 使用 sklearn 中的 BaggingRegressor 的结果如下 下次见
http://www.hkea.cn/news/14454850/

相关文章:

  • 智慧团建电脑版注册登录入口搜索引擎优化大致包含哪些内容或环节
  • 网站制作网站价格微信开发者模式
  • 做效果图的外包网站百度网盘网页
  • 中国文明网联盟网站建设嘉兴网站建设全包
  • 个人怎么做购物网站女程序员可以干到多少岁
  • 长沙seo网站排名优化公司学做软件的网站有哪些
  • 哪个网站推广比较好中国推广网
  • 来宾绍兴seo网站托管方案如何做网站网页流程
  • 设计素材网站服装舆情分析师需要具备哪些技能
  • 制作公司网站 价格红酒企业网站建设
  • 南京做网站制作公司湘潭网站建设 水平磐石网络
  • 网站左侧导航源码建筑公司排名前100强
  • 太原深圳建设工程信息网站医保局微网站开发
  • 个人网站设计报告书园区建设网站的方案
  • 宝山网站建设宝山开发公司管理软件
  • 网站内容需要备案吗sousou提交网站入口
  • 网站开发eq编辑器vr全景网站开发制作
  • 优质的专业网站建设平湖市规划建设局网站
  • 网站网页设计中怎么添加页码信息企业网站制作建站公司
  • 怎么做一个网站app吗广告策划书范本
  • 厦门响应式网站建设安卓市场wordpress主题
  • 装修类网站模板下载wordpress用什么开发工具
  • 上市公司查询网站做视频网站的空间
  • 石家庄网站建设求职简历apmserv安装wordpress
  • 选网站建设公司有什么注意的福田瑞沃自卸车官网
  • c 网站开发入门视频react网站开发
  • 网站建设学习多少钱wordpress主题网站
  • 免费源码资源源码站go企业网站黄页怎么做
  • 建网站资料网站开发流行
  • 制作英文网站多少钱手机版百度一下