当前位置: 首页 > news >正文

欧美一级A做爰片成电影网站百度排名怎么做

欧美一级A做爰片成电影网站,百度排名怎么做,自己做网站需要学些什么,html5移动网站开发流程1. 概念理解 逻辑回归#xff0c;简称LR#xff0c;它的特点是能够将我们的特征输入集合转化为0和1这两类的概率。一般来说#xff0c;回归不用在分类问题上#xff0c;但逻辑回归却能在二分类(即分成两类问题)上表现很好。 逻辑回归本质上是线性回归#xff0c;只是在特…1. 概念理解 逻辑回归简称LR它的特点是能够将我们的特征输入集合转化为0和1这两类的概率。一般来说回归不用在分类问题上但逻辑回归却能在二分类(即分成两类问题)上表现很好。 逻辑回归本质上是线性回归只是在特征到结果的映射中加入了一层Sigmod函数映射即先把特征线形求和然后使用Sigmoid函数将最为假设函数来概率求解再进行分类。 Sigmoid函数为  sigmoid函数形如s曲线下侧无限接近0上侧无限接近1 例如在进行预测的过程中预测结果大于0.5的认为是属于一类小于0.5的我们认为是第二类进而我们实现二分类。 优点 适合需要得到一个分类概率的场景简单速度快 缺点 只能用来处理二分类问题不好处理多分类问题 应用 是否患病、金融诈骗、是否虚假账号等 2. 精确率和召回率 如下表所示如果我预测出一个人得了癌症他的真实值也是得了癌症那么这种情况称为TP真正例如果我预测出一个人得了癌症而他的真实值是没有得癌症这种情况称为FN假反例。 1精确率预测结果为正例样本中真实为正例的比例用于表示查得准不准 公式为  例100个人中我预测的结果是有20个人得了癌症。在这20个人中真实得癌症的只有5个人没得癌症的有15人。那么精确率为 P5/(515)0.25 2召回率真实为正例的样本中预测结果为正例的比例表示查的全对正样本的区分能力 公式为  例现在有20个人得了癌症在这些人中我检测到有18个人得了癌症还有2个人没有检测出来召回率R18/(182) 3综合指标P和R指标有时候会出现的矛盾的情况这样就需要综合考虑他们最常见的方法就是F-Measure。 公式为  若F1较大的话综合性能较好 导入方法 from sklearn.metrics import classification_report classification_report()  函数参数 y_true1维数组或标签指示器数组/稀疏矩阵真实值。 y_pred1维数组或标签指示器数组/稀疏矩阵预测值 labels列表shape [n_labels]报表中包含的标签索引的可选列表。 target_names字符串列表与标签匹配的可选显示名称相同顺序 sample_weight类似于shape [n_samples]的数组可选项样本权重  digitsint输出浮点值的位数 3. 实例应用 -- 癌症病例预测 3.1 Sklearn 实现 逻辑回归方法导入 from sklearn.linear_model import LogisticRegression 参数设置 参考博客 https://blog.csdn.net/jark_/article/details/78342644 penalty惩罚项str类型可选参数为l1和l2默认为l2。用于指定惩罚项中使用的规范。 L1规范假设的是模型的参数满足拉普拉斯分布L2假设的模型参数满足高斯分布。所谓的范式就是加上对参数的约束使得模型不会过拟合加约束的情况下理论上应该可以获得泛化能力更强的结果。 dual对偶或原始方法bool类型默认为False。对偶方法只用在求解线性多核的L2惩罚项上。当样本数量样本特征的时候dual通常设置为False。 tol停止求解的标准float类型默认为1e-4。就是求解到多少的时停止认为已经求出最优解。 C正则化系数λ的倒数float类型默认为1.0。必须是正浮点型数。像SVM一样越小的数值表示越强的正则化。 fit_intercept是否存在截距或偏差bool类型默认为True。 intercept_scaling仅在正则化项为”liblinear”且fit_intercept设置为True时有用。float类型默认为1。class_weight用于标示分类模型中各种类型的权重可以是一个字典或者’balanced’字符串默认为不输入也就是不考虑权重即为None。 如果选择输入的话可以选择balanced让类库自己计算类型权重或者自己输入各个类型的权重。举个例子比如对于0,1的二元模型我们可以定义class_weight{0:0.9,1:0.1}这样类型0的权重为90%而类型1的权重为10%。如果class_weight选择balanced那么类库会根据训练样本量来计算权重。某种类型样本量越多则权重越低样本量越少则权重越高。当class_weight为balanced时类权重计算方法如下n_samples / (n_classes * np.bincount(y))。n_samples为样本数n_classes为类别数量np.bincount(y)会输出每个类的样本数例如y[1,0,0,1,1],则np.bincount(y)[2,3]。 random_state随机数种子int类型可选参数默认为无仅在正则化优化算法为sag,liblinear时有用。 solver优化算法选择参数只有五个可选参数即newton-cg, lbfgs, liblinear, sag, saga。默认为liblinear。 solver参数决定了我们对逻辑回归损失函数的优化方法有四种算法可以选择分别是liblinear使用了开源的liblinear库实现内部使用了坐标轴下降法来迭代优化损失函数。lbfgs拟牛顿法的一种利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。newton-cg牛顿法的一种利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。sag即随机平均梯度下降是梯度下降法的变种和普通梯度下降法的区别是每次迭代仅仅用一部分的样本来计算梯度适合于样本数据多的时候。saga线性收敛的随机优化算法的的变重。 verbose日志冗长度int类型。默认为0。就是不输出训练过程1的时候偶尔输出结果大于1对于每个子模型都输出。 warm_start热启动参数bool类型。默认为False。如果为True则下一次训练是以追加树的形式进行重新使用上一次的调用作为初始化。 3.1 癌症预测 数据集包含10项特征值数据和1项目标数据字符?代表缺失数据目标中数字2代表癌症良性4代表癌症恶性。 数据集下载地址Index of /ml/machine-learning-databases/breast-cancer-wisconsin names中存放的是每一项数据的列索引名称pandas导入数据集时会默认将数据第一行当作数据索引名而原数据没有列索引名我们需要自定义列 pd.read_csv(文件路径,names列名称) #1数据获取 import pandas as pd import numpy as np # 癌症数据路径 filepath C:\\Users\\admin\\.spyder-py3\\test\\文件处理\\癌症\\breast-cancer-wisconsin.data # 癌症的每一项特征名 names [Sample code number, Clump Thickness, Uniformity of Cell Size, Uniformity of Cell Shape,Marginal Adhesion, Single Epithelial Cell Size, Bare Nuclei, Bland Chromatin,Normal Nucleoli, Mitoses, Class] # breast存放癌症数据不默认将第一行作为列索引名自定义列索引名 breast pd.read_csv(filepath,namesnames) # 查看唯一值Class这列代表的是否得癌症使用.unique()函数查看该列有哪些互不相同的值 unique breast[Class].unique() #只有两种情况是二分类问题2代表良性4代表恶性3.2 数据处理  首先通过 .info() 函数查看数据中是否存在缺失数据nan和重复数据本例子中没有。然后对字符?进行处理先将?转换成nan值再使用 .dropna() 函数将nan所在的行删除。完成以后划分特征值和目标值。再划分训练集和测试集测试集取25%的数据。 #2数据处理 breast.info() #查看是否有缺失值、重复数据 # 该数据集存在字符串类型数据? # 将?转换成nan breast breast.replace(to_replace?,valuenp.nan) # 将nan所在的行删除 breast breast.dropna()# 特征值是除了class列以外的所有数据 features breast.drop(Class,axis1) # 目标值是class这一列 targets breast[Class]#3划分训练集和测试集 from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test train_test_split(features,targets,test_size0.25)3.3 标准化处理 由于单位不一以及数据跨度过大等问题会影响模型准确度因此对训练数据的和测试数据的特征值进行标准化处理。特征工程的具体方法会在后续章节中介绍此处先做了解。 #4特征工程 # 导入标准化方法 from sklearn.preprocessing import StandardScaler # 接收标准化方法 transfer StandardScaler() # 对训练的特征值x_train提取特征并标准化处理 x_train transfer.fit_transform(x_train) # 对测试的特征值x_test标准化处理 x_test transfer.transform(x_test)3.4 逻辑回归预测 由于癌症数据中结果只有2和4良性和恶性属于二分问题可以使用逻辑回归方法来预测此处为方便各位理解采用默认参数的逻辑回归方法。其中.fit()函数接收训练模型所需的特征值和目标值预测函数.predict()接收的是预测所需的特征值评分法.score()通过真实结果和预测结果计算准确率。计算得到的模型准确率为0.97 #5逻辑回归预测 # 导入逻辑回归方法 from sklearn.linear_model import LogisticRegression # 接收逻辑回归方法 logist LogisticRegression() # penaltyl2正则化tol0.001损失函数小于多少时停止C1惩罚项越小惩罚力度越小是岭回归的乘法力度的分之一 # 训练 logist.fit(x_train,y_train) # 预测 y_predict logist.predict(x_test) # 评分法计算准确率 accuracy logist.score(x_test,y_test) 3.5 准确率和召回率 #6准确率和召回率 # 导入 from sklearn.metrics import classification_report # classification_report() # 参数(真实值,预测值,labelsNone,target_namesNone) # labelsclass列中每一项如该题的2和4给它们取名字 # target_names命名# 计算准确率和召回率 res classification_report(y_test,y_predict,labels[2,4],target_names[良性,恶性]) print(res)precision表示准确率recall表示召回率f1-score表示综合指标support表示预测的人数。本模型的召回率良性达到0.97恶性达到0.96该例子是检测癌症我们希望能找到所有得癌症的人即使他不是癌症也可以做进一步检查因此我们需要一个召回率高的模型。  数据集获取 Index of /ml/machine-learning-databases/breast-cancer-wisconsin 完整代码 #1数据获取 import pandas as pd import numpy as np # 癌症数据路径 filepath C:\\Users\\admin\\.spyder-py3\\test\\文件处理\\癌症\\breast-cancer-wisconsin.data # 癌症的每一项特征名 names [Sample code number, Clump Thickness, Uniformity of Cell Size, Uniformity of Cell Shape,Marginal Adhesion, Single Epithelial Cell Size, Bare Nuclei, Bland Chromatin,Normal Nucleoli, Mitoses, Class] # breast存放癌症数据不默认将第一行作为列索引名自定义列索引名 breast pd.read_csv(filepath,namesnames) # 查看唯一值Class这列代表的是否得癌症使用.unique()函数查看该列有哪些互不相同的值 unique breast[Class].unique() #只有两种情况是二分类问题2代表良性4代表恶性#2数据处理 breast.info() #查看是否有缺失值、重复数据 # 该数据集存在字符串类型数据? # 将?转换成nan breast breast.replace(to_replace?,valuenp.nan) # 将nan所在的行删除 breast breast.dropna()# 特征值是除了class列以外的所有数据 features breast.drop(Class,axis1) # 目标值是class这一列 targets breast[Class]#3划分训练集和测试集 from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test train_test_split(features,targets,test_size0.25)#4特征工程 # 导入标准化方法 from sklearn.preprocessing import StandardScaler # 接收标准化方法 transfer StandardScaler() # 对训练的特征值x_train提取特征并标准化处理 x_train transfer.fit_transform(x_train) # 对测试的特征值x_test标准化处理 x_test transfer.transform(x_test)#5逻辑回归预测 # 导入逻辑回归方法 from sklearn.linear_model import LogisticRegression # 接收逻辑回归方法 logist LogisticRegression() # penaltyl2正则化tol0.001损失函数小于多少时停止C1惩罚项越小惩罚力度越小是岭回归的乘法力度的分之一 # 训练 logist.fit(x_train,y_train) # 预测 y_predict logist.predict(x_test) # 评分法计算准确率 accuracy logist.score(x_test,y_test)#6准确率和召回率 # 导入 from sklearn.metrics import classification_report # classification_report() # 参数(真实值,预测值,labelsNone,target_namesNone) # labelsclass列中每一项如该题的2和4给它们取名字 # target_names命名# 计算准确率和召回率 res classification_report(y_test,y_predict,labels[2,4],target_names[良性,恶性]) # precision准确率recall召回率综合指标F1-scoresupport预测的人数 print(res)
http://www.hkea.cn/news/14592863/

相关文章:

  • 响应式网站 教程django做购物网站
  • 建设银行开通网站查询密码如何策划一个营销方案
  • 建筑模版东莞网站建设技术支持网站开发申请报告
  • seo营销型网站推广vultr宝塔wordpress
  • 哪里可以接网站开发的活pc网站建设怎么做
  • 网站建设丨金手指谷哥14wordpress 模板 下载
  • 哈尔滨建设网站哪家好做盗版电影网站吗
  • 郑州妇科杭州龙席网络seo
  • 情感视频素材网站在线视频用什么网址
  • 博优云软件官方网站网站建设策划完整方案
  • 哪个网站是专门做装修的wordpress 多图上传插件
  • 做网站服务器一年多少钱天津网站建设开发
  • 江阴网站建设哪家好网页制作教程素材
  • 江苏网站seo优化网站没制作好可以备案吗
  • 建设自己网站的流程wordpress图片链接插件
  • 用wp做网站备案网站开发如何
  • 一页网站wordpress quiz
  • 网站建设预算表北京公司可以在上海建网站吗
  • 网站模版 拓近期楼市最新消息
  • 求网站建设网站优化工作免费的云服务器哪家好
  • php做网站半成品网络科技有限公司网站
  • 免费网站推广o2o电子商务平台有哪些
  • 网站建设 主机选择asp网站部署 iis7
  • 石家庄招聘哪个网站做的好网站建设项目软件开发招标文件
  • 营销型网站有哪些手机软件下载大全
  • 公司网页网站建设+ppt模板下载沈阳做网站的公司有哪些
  • 网站asp文件只读手机商城网站建设
  • 做网站必须要公网ip有没有教做川菜的网站
  • 枣庄建网站的公司重庆宣传片2023
  • 怎么编辑网站源代码深圳营销型网站建设+宝安西乡