当前位置: 首页 > news >正文

网络公司具体是干什么的优化是什么意思?

网络公司具体是干什么的,优化是什么意思?,网站系统怎么用,wordpress 屏蔽Multinomial Naive Bayes#xff1a;用于多项式模型的Naive Bayes分类器 一、算法思路 多项式Naive Bayes分类器适用于离散特征分类#xff08;如文本分类中的字数#xff09; 多叉分布通常需要整数特征计数 不过#xff0c;在实际应用中#xff0c;分数计数#xff08…Multinomial Naive Bayes用于多项式模型的Naive Bayes分类器 一、算法思路 多项式Naive Bayes分类器适用于离散特征分类如文本分类中的字数 多叉分布通常需要整数特征计数 不过在实际应用中分数计数如 tf-idf也可以起作用 二、官网API 官网API 导包from sklearn.naive_bayes import MultinomialNB class sklearn.naive_bayes.MultinomialNB(*, alpha1.0, force_alphawarn, fit_priorTrue, class_priorNone)①平滑参数alpha 加法拉普拉斯/利德斯通平滑参数设置 alpha0 和 force_alphaTrue 表示不平滑 浮点数默认为1.0 也可以传入array形式array为各个特征值 具体官网详情如下 使用方法 MultinomialNB(alpha1.2) 或者 beyond [cat,dog] multinomial MultinomialNB(alphabeyond) ②force_alpha 如果为False且alpha小于1e-10则会将alpha设置为1e-10默认值 如果为Truealpha将保持不变 如果alpha太接近0可能会导致数字错误 具体官网详情如下 使用方法 MultinomialNB(force_alphaTrue) ③fit_prior 是否学习类别先验概率。如果为False将使用统一先验默认值为True 具体官网详情如下 使用方法 MultinomialNB(fit_priorFalse) ④类别先验概率class_prior class_prior类别的先验概率如果指定则不会根据数据调整先验概率默认值为None 具体官网详情如下 使用方法 beyond [cat,dog] multinomial MultinomialNB(class_priorbeyond) ⑤最终构建模型 MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse) 三、代码实现 ①导包 这里需要评估、训练、保存和加载模型以下是一些必要的包若导入过程报错pip安装即可 import numpy as np import pandas as pd import matplotlib.pyplot as plt import joblib %matplotlib inline import seaborn as sns from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import confusion_matrix, classification_report, accuracy_score②加载数据集 数据集可以自己简单整个csv格式即可我这里使用的是6个自变量X和1个因变量Y fiber pd.read_csv(./fiber.csv) fiber.head(5) #展示下头5条数据信息③划分数据集 前六列是自变量X最后一列是因变量Y 常用的划分数据集函数官网APItrain_test_split test_size测试集数据所占比例 train_size训练集数据所占比例 random_state随机种子 shuffle是否将数据进行打乱 因为我这里的数据集共48个训练集0.75测试集0.25即训练集36个测试集12个 X fiber.drop([Grade], axis1) Y fiber[Grade]X_train, X_test, y_train, y_test train_test_split(X,Y,train_size0.75,test_size0.25,random_state42,shuffleTrue)print(X_train.shape) #(36,6) print(y_train.shape) #(36,) print(X_test.shape) #(12,6) print(y_test.shape) #(12,)④构建MultinomialNB模型 参数可以自己去尝试设置调整 multinomial MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse)⑤模型训练 就这么简单一个fit函数就可以实现模型训练 multinomial.fit(X_train,y_train)⑥模型评估 把测试集扔进去得到预测的测试结果 y_pred multinomial.predict(X_test)看看预测结果和实际测试集结果是否一致一致为1否则为0取个平均值就是准确率 accuracy np.mean(y_predy_test) print(accuracy)也可以通过score得分进行评估计算的结果和思路都是一样的都是看所有的数据集中模型猜对的概率只不过这个score函数已经封装好了当然传入的参数也不一样需要导入accuracy_score才行from sklearn.metrics import accuracy_score score multinomial.score(X_test,y_test)#得分 print(score)⑦模型测试 拿到一条数据使用训练好的模型进行评估 这里是六个自变量我这里随机整个test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) 扔到模型里面得到预测结果prediction multinomial.predict(test) 看下预测结果是多少是否和正确结果相同print(prediction) test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) prediction multinomial.predict(test) print(prediction) #[2]⑧保存模型 multinomial是模型名称需要对应一致 后面的参数是保存模型的路径 joblib.dump(multinomial, ./multinomial.model)#保存模型⑨加载和使用模型 multinomial_yy joblib.load(./multinomial.model)test np.array([[11,99498,5369,9045.27,28.47,3827588.56]])#随便找的一条数据 prediction multinomial_yy.predict(test)#带入数据预测一下 print(prediction) #[4]完整代码 模型训练和评估不包含⑧⑨。 import numpy as np import pandas as pd import matplotlib.pyplot as plt import joblib %matplotlib inline import seaborn as sns from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import confusion_matrix, classification_report, accuracy_scorefiber pd.read_csv(./fiber.csv) fiber.head(5) #展示下头5条数据信息X fiber.drop([Grade], axis1) Y fiber[Grade]X_train, X_test, y_train, y_test train_test_split(X,Y,train_size0.75,test_size0.25,random_state42,shuffleTrue)print(X_train.shape) #(36,6) print(y_train.shape) #(36,) print(X_test.shape) #(12,6) print(y_test.shape) #(12,)multinomial MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse) multinomial.fit(X_train,y_train)y_pred multinomial.predict(X_test) accuracy np.mean(y_predy_test) print(accuracy) score multinomial.score(X_test,y_test)#得分 print(score)test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) prediction multinomial.predict(test) print(prediction) #[2]
http://www.hkea.cn/news/14363569/

相关文章:

  • 淘客免费网站建设认证空间如何显示网站
  • 中国网站备案工商管理网站
  • 学校网站开发报价表杭州做网站费用
  • 做网站的带宽wordpress主题清除数据
  • 网站建设业务越做越累wordpress5.0编辑器文本格式
  • 自适应网站如何做mip律师网站维护
  • 电商网站取名专业团队口号沙雕
  • 极乐宝盒网站建设北京网站优化济南兴田德润简介电话
  • 哈尔滨建设网站的免费咨询东莞专业网站设计建站公司
  • wordpress 多媒体快速排名优化
  • 申请网站价格网站开发要用cms
  • 烟台网站建设科技权威发布四字图片
  • 网站开发详细设计文档惠州排名推广
  • 网站开发人员构成263企业邮箱后缀
  • 小学微机作业做网站企业 网站 建设 规范
  • 沈阳定制网站手机做网页的软件
  • 北京南站是高铁站吗知乎seo优化
  • 永川网站制作联系电话企业网站源码带手机版
  • 网站关键词优化原理免费网站app下载汅api
  • 做外贸怎样打开国外网站电销系统软件排名
  • 网站源码下载了属于侵权吗免费建设网站赚钱
  • 怎么做网站h汉狮小制作小发明手工初中
  • 青岛西海岸新区城市建设局网站wordpress1.4
  • 德国的网站后缀沈阳自助模板建站
  • 邢台网站改版怎么开发html论坛源码
  • 知识付费网站搭建教程wordpress图标显示
  • 黄岩区建设局网站天津网站开发招聘
  • 绵阳模板网站天津建设工程信息网上网流程
  • 邯郸网站设计价格网站右下角浮动效果如何做
  • 网站弹出公告代码WordPress ngrok