当前位置: 首页 > news >正文

句容网站做网站是不是也是暴利

句容网站,做网站是不是也是暴利,建设工程交易中心网站收费标准,车票网站模板以下内容#xff0c;皆为原创#xff0c;重在无私分享高质量知识#xff0c;制作实属不易#xff0c;请点点关注。 好戏开场了~~~(这关涉及到了加载数据集的代码#xff0c;下一关#xff0c;教你们安装机器学习库) 一.数据集 这一关的目标 知道数据集被分为训练集和测…以下内容皆为原创重在无私分享高质量知识制作实属不易请点点关注。 好戏开场了~~~(这关涉及到了加载数据集的代码下一关教你们安装机器学习库) 一.数据集 这一关的目标 知道数据集被分为训练集和测试集会使用sklearn的数据集                                                       1.可用数据集  scikit-learn网址scikit-learn: machine learning in Python — scikit-learn 1.5.1 documentation UCI网址UCI Machine Learning Repository Kaggle网址Bohrium scikit-learn        数据量小方便学习 UCI            收录360个数据集覆盖科技、生活、经济等领域数据量几十万。Kaggle       大数据竞赛平台真实数据数据量巨大          如以下图所示这个就是UCI机器学习的网站和scikit-learn机器学习的网站。 二.使用sclearn数据集 1.scikit-learn数据集API介绍 # 用sklearn中的datasets方法(sklearn.datasets)1.加载获取流行数据集2.datasets.load_*()获取小规模数据集数据包含在datasets中3.datasets。fetch_*(data_homeNone)获取大规模数据集需要从网上下载函数第一个参数是data_home表示数据集下载的目录。你可以自己定义位置。C盘D盘都行2.sklearn小数据集 加载并返回鸢尾花数据集。当然还有一个常见的波士顿房价数据集但是 load_boston has been removed from scikit-learn since version 1.2.这个是我在加载波士顿房价数据集出现的报错所以要注意好自己的版本。 import sklearn from sklearn.datasets import load_iris# Load the iris dataset print(sklearn.datasets.load_iris()) 这个就是我在jupyter notebook里打印出来鸢尾花的数据集。 鸢尾花数据集 名称数量类别 3 特征4样本数量150每个类别数量5 3.sklearn大数据集   加载大数据集我们就要用fetch_*用于加载大数据集。那个*指的是加载的数据集的名称。 3.1 sklearn数据集返回值介绍 load和fetch返回的数据类型datasets.base.Bunch(字典格式) data:特征数据数组target目标数组标签数组DESCR数据描述feature_names特征名target_names:目标名标签名                 from sklearn.datasets import load_iris # 将加载的数据集传给iris变量 iris load_iris() print(鸢尾花的数据集:\n, iris) print(查看鸢尾花的特征值:\n, iris[data]) print(查看鸢尾花的目标值:\n, iris.target) print(查看鸢尾花特征的名字:\n, iris.feature_names) print(查看鸢尾花目标值的名字:\n, iris.target_names) print(查看数据集描述:\n, iris[DESCR]) 字典的元素是键值对的形式所以获取值的方式有两种: dict[key] value bunch.key value 三.训练模型 思考要不要用全部数据来训练一个模型 内心独白肯定不行啊你要一部分来进行模型评估啊看你的模型好不好。 所以数据集分为训练集用于训练构建模型和测试集在模型核验时用于评估模型是否有效。 划分的标准上下组合 1.训练数据70%        80%        75% 2.测试数据30%        20%        30% 我们希望训练的模型好一点所以让训练集多一点。 # 导入加载鸢尾花数据集的方法 from sklearn.datasets import load_iris # 导入划分数据集的方法 from sklearn.model_selection import train_test_split# 加载鸢尾花数据 iris load_iris()# 有了加载数据才能划分数据集 # 这四个分别对应后面方法的四个返回值训练集的特征值测试集的特征值训练集的目标值 测试集的目标值 x_train, x_test, y_train, y_test train_test_split(iris.data, iris.target, test_size0.2, random_state22) print(训练集的特征值, x_train, x_train.shape) 四.懵笔时刻 在划分数据集时那四个变量为什么这么命名 不错问得好。举个例子在数学中我们都是有X值去求Y值那么Y就是我们的目标值。所以X就是数据集的特征值Y就是数据集的目标值。后面方法里的参数test_size是测试集的大小一般为float类型20%0.2,以此类推。random_state是随机数种子不同的种子造成不同的随机采样结果相同的种子采样结果相同。 为什么要用四个变量而不是三个或者五个变量 因为那个方法就是返回的四个值啊我能有什么办法what can I say return 训练集的特征值测试集的特征值。训练集的目标值测试集的目标值。 五.谢谢大家的观看后续持续分享高质量内容~~~~
http://www.hkea.cn/news/14336513/

相关文章:

  • 贵阳网站建设王道下拉惠网站 公司形象
  • 网页设计网站开发培训公司网站制作的方法
  • 销售型网站建设承德信息发布微信平台
  • 汕头汽车网站建设国内个人网站搭建
  • 大同市住房城乡建设网站长沙做优化的公司
  • 网站优化怎么学工作室官网
  • 网站前端如何做兼职2023网站推广入口
  • 新型门窗网站模板淘宝网是中国最大的c2c平台
  • 福州做推广有哪些网站高端医院网站建设
  • 自己做网站用什么软件微信 wordpress插件
  • 网站做收款要什么条件百度一下做网站
  • 重新安wordpress网站高校网站建设方案
  • 做网站的网址怎么弄竹业网站建设
  • 网站建设意见建议河南专业网站建设开发团队
  • 房产信息网站系统官网做的好看的网站有哪些
  • 网站备案期间做什么班级网站怎么做ppt
  • jq动画效果网站wordpress文章备份插件
  • 无锡 公共建设中心网站中国网站有哪些
  • 网站自主制作平台广东网页制作推广
  • h5网站的优势wordpress 安装中文
  • 小公司做网站需要注意什么响水做网站的价格
  • 网站建好了seo怎么做学的专业是编课 网站开发英语翻译
  • 如何查看网站服务器类型如何查网站的百度快照
  • 承接网站建设男女做暧昧视频网站
  • 深圳网站建设首选上榜网络装修网站怎么做的好
  • 免费设计网站素材如何设计网站后台
  • 网站建设种类微信小程序开发教程官方文档
  • 网站建设程序开发注册公司费用会计分录
  • 苏州建设交易中心网站法治网站的建设整改措施
  • 网站进度条做多大wordpress开启缩略图