平谷手机网站建设,哪个网站推广比较好,百度推广如何获取精准的客户,网站建设评审验收会议主持词目录
机器学习术语
标签
特性
示例
模型
回归与分类
深入了解机器学习#xff1a;线性回归
深入了解机器学习#xff1a;训练和损失
平方损失函数#xff1a;一种常用的损失函数 机器学习术语
预计用时#xff1a;8 分钟
什么是#xff08;监督式#xff…目录
机器学习术语
标签
特性
示例
模型
回归与分类
深入了解机器学习线性回归
深入了解机器学习训练和损失
平方损失函数一种常用的损失函数 机器学习术语
预计用时8 分钟
什么是监督式机器学习简而言之如下所示
机器学习系统学习如何组合输入以对从未见过的数据生成有用的预测。
我们来探索一下机器学习的基本术语。
标签
标签是指我们要预测的内容即简单线性回归中的 y 变量。标签可以是小麦的未来价格、图片中显示的动物类型、音频剪辑的含义也可以是其他任何信息。
特性
特征是输入变量即简单线性回归中的 x 变量。一个简单的机器学习项目可能会使用单个功能而更复杂的机器学习项目可以使用数百万个功能如下所示
在垃圾邮件检测器示例中这些功能可能包括
电子邮件文字中的字词发件人的地址发送电子邮件的时间电子邮件中包含词组“一种奇怪的技巧”。
示例
样本是指数据的特定实例x。我们将 x 显示为粗体表示它是一个矢量。我们将示例分为两类
有标签样本无标签样本
有标签样本同时包含特征和标签。具体来说 labeled examples: {features, label}: (x, y)使用有标签样本来训练模型。在我们的垃圾邮件检测器示例中有标签样本是指用户明确标记为“垃圾邮件”或“不是垃圾邮件”的个别电子邮件。
例如下表显示了从包含加利福尼亚州房价信息的数据集中获取的 5 个有标签样本
homeMedianAge 功能会议室总数 设施卧室总数 设施medianHouseValue 标签15561212836690019765019018010017720174857001415013377340020145432665500
无标签样本包含特征但不包含标签。具体来说 unlabeled examples: {features, ?}: (x, ?)以下是来自同一住房数据集的 3 个无标签样本不包括 medianHouseValue
homeMedianAge 功能会议室总数 设施卧室总数 设施421686361341226180331077271
使用有标签样本训练模型后我们便会使用该模型来预测无标签样本的标签。在垃圾邮件检测器中无标签样本是用户尚未添加标签的新电子邮件。
模型
模型定义了特征和标签之间的关系。例如垃圾内容检测模型可能会将某些功能与“垃圾内容”紧密关联。我们重点介绍模型生命周期的两个阶段 训练是指创建或学习模型。也就是说您向模型展示有标签样本让模型逐渐学习特征与标签之间的关系。 推断表示将经过训练的模型应用于无标签样本。也就是说使用经过训练的模型做出有用的预测 (y)。例如在推理期间您可以针对新的无标签样本预测 medianHouseValue。
回归与分类
回归模型可预测连续值。例如回归模型做出的预测可回答如下问题 加利福尼亚州一栋房子的价值是多少 用户点击此广告的可能性有多大
分类模型可预测离散值。例如分类模型做出的预测可回答如下问题 指定的电子邮件是垃圾邮件还是非垃圾邮件 这是狗、猫还是仓鼠的图片
关键术语 分类模型 示例 功能 推断 标签 模型 回归模型 训练深入了解机器学习线性回归
预计用时6 分钟
长久以来人们都知道板球昆虫物种在天气炎热的日子里会比在更冷的日子里鸣叫。数十年来专业和业余科学家一直在编制每分钟的鸣叫声和温度方面的数据。Ruth 大姨妈给您送上生日祝福送上一份生日礼物邀请您学习一个模型来预测这种关系。 您想利用这些数据来探索这种关系。
首先通过绘制数据的方式检查数据 图 1. 每分钟的鸣叫声与温度以摄氏度为单位。
如您所料该图表显示了温度随着鸣叫声次数的增加而上升。 鸣叫声与温度之间的关系是线性关系吗可以您可以绘制一条直线来大致说明这种关系 图 2. 一种线性关系。 关键术语 偏差 推断 线性回归 重量深入了解机器学习训练和损失 预计用时6 分钟
训练模型只需从有标签样本中学习确定所有权重和偏差的理想值。在监督式学习中机器学习算法通过检查许多示例并尝试找到将损失降至最低的模型来构建模型此过程称为经验风险最小化。
损失是错误预测的惩罚。也就是说损失是一个表示模型在单个样本上的预测质量的数字。如果模型的预测完全准确则损失为零否则损失会更大。训练模型的目的是从所有样本中找到一组平均损失“较小”的权重和偏差。例如图 3 左侧显示的是高损失模型右侧显示的是低损失模型。对于该图请注意以下几点
箭头表示损失。蓝线表示预测。图 3. 左侧模型中的损失较高右侧模型中的损失较低。 请注意左侧曲线图中的箭头比右侧曲线图中的箭头长得多。显然相较于左侧曲线图中的线条右侧曲线图中的预测模型要好得多。
您可能想知道是否可以创建数学函数损失函数以有意义的方式汇总各个损失。
平方损失函数一种常用的损失函数
我们在此探讨的线性回归模型使用一种称为平方损失函数也称为 L2 损失的损失函数。单个样本的平方损失如下 the square of the difference between the label and the prediction (observation - prediction(x))2 (y - y)2关键术语 经验风险最小化 损失 均方误差 平方损失函数 训练https://developers.google.com/machine-learning/crash-course/ml-intro?hlzh-cn