当前位置：首页 > news >正文

网络公司具体是干什么的优化是什么意思?

news 2026/4/22 4:35:55

网络公司具体是干什么的,优化是什么意思?,网站系统怎么用,wordpress 屏蔽Multinomial Naive Bayes#xff1a;用于多项式模型的Naive Bayes分类器一、算法思路多项式Naive Bayes分类器适用于离散特征分类#xff08;如文本分类中的字数#xff09; 多叉分布通常需要整数特征计数不过#xff0c;在实际应用中#xff0c;分数计数#xff08…Multinomial Naive Bayes用于多项式模型的Naive Bayes分类器一、算法思路多项式Naive Bayes分类器适用于离散特征分类如文本分类中的字数多叉分布通常需要整数特征计数不过在实际应用中分数计数如 tf-idf也可以起作用二、官网API 官网API 导包from sklearn.naive_bayes import MultinomialNB class sklearn.naive_bayes.MultinomialNB(*, alpha1.0, force_alphawarn, fit_priorTrue, class_priorNone)①平滑参数alpha 加法拉普拉斯/利德斯通平滑参数设置 alpha0 和 force_alphaTrue 表示不平滑浮点数默认为1.0 也可以传入array形式array为各个特征值具体官网详情如下使用方法 MultinomialNB(alpha1.2) 或者 beyond [cat,dog] multinomial MultinomialNB(alphabeyond) ②force_alpha 如果为False且alpha小于1e-10则会将alpha设置为1e-10默认值如果为Truealpha将保持不变如果alpha太接近0可能会导致数字错误具体官网详情如下使用方法 MultinomialNB(force_alphaTrue) ③fit_prior 是否学习类别先验概率。如果为False将使用统一先验默认值为True 具体官网详情如下使用方法 MultinomialNB(fit_priorFalse) ④类别先验概率class_prior class_prior类别的先验概率如果指定则不会根据数据调整先验概率默认值为None 具体官网详情如下使用方法 beyond [cat,dog] multinomial MultinomialNB(class_priorbeyond) ⑤最终构建模型 MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse) 三、代码实现 ①导包这里需要评估、训练、保存和加载模型以下是一些必要的包若导入过程报错pip安装即可 import numpy as np import pandas as pd import matplotlib.pyplot as plt import joblib %matplotlib inline import seaborn as sns from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import confusion_matrix, classification_report, accuracy_score②加载数据集数据集可以自己简单整个csv格式即可我这里使用的是6个自变量X和1个因变量Y fiber pd.read_csv(./fiber.csv) fiber.head(5) #展示下头5条数据信息③划分数据集前六列是自变量X最后一列是因变量Y 常用的划分数据集函数官网APItrain_test_split test_size测试集数据所占比例 train_size训练集数据所占比例 random_state随机种子 shuffle是否将数据进行打乱因为我这里的数据集共48个训练集0.75测试集0.25即训练集36个测试集12个 X fiber.drop([Grade], axis1) Y fiber[Grade]X_train, X_test, y_train, y_test train_test_split(X,Y,train_size0.75,test_size0.25,random_state42,shuffleTrue)print(X_train.shape) #(36,6) print(y_train.shape) #(36,) print(X_test.shape) #(12,6) print(y_test.shape) #(12,)④构建MultinomialNB模型参数可以自己去尝试设置调整 multinomial MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse)⑤模型训练就这么简单一个fit函数就可以实现模型训练 multinomial.fit(X_train,y_train)⑥模型评估把测试集扔进去得到预测的测试结果 y_pred multinomial.predict(X_test)看看预测结果和实际测试集结果是否一致一致为1否则为0取个平均值就是准确率 accuracy np.mean(y_predy_test) print(accuracy)也可以通过score得分进行评估计算的结果和思路都是一样的都是看所有的数据集中模型猜对的概率只不过这个score函数已经封装好了当然传入的参数也不一样需要导入accuracy_score才行from sklearn.metrics import accuracy_score score multinomial.score(X_test,y_test)#得分 print(score)⑦模型测试拿到一条数据使用训练好的模型进行评估这里是六个自变量我这里随机整个test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) 扔到模型里面得到预测结果prediction multinomial.predict(test) 看下预测结果是多少是否和正确结果相同print(prediction) test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) prediction multinomial.predict(test) print(prediction) #[2]⑧保存模型 multinomial是模型名称需要对应一致后面的参数是保存模型的路径 joblib.dump(multinomial, ./multinomial.model)#保存模型⑨加载和使用模型 multinomial_yy joblib.load(./multinomial.model)test np.array([[11,99498,5369,9045.27,28.47,3827588.56]])#随便找的一条数据 prediction multinomial_yy.predict(test)#带入数据预测一下 print(prediction) #[4]完整代码模型训练和评估不包含⑧⑨。 import numpy as np import pandas as pd import matplotlib.pyplot as plt import joblib %matplotlib inline import seaborn as sns from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split from sklearn.naive_bayes import MultinomialNB from sklearn.metrics import confusion_matrix, classification_report, accuracy_scorefiber pd.read_csv(./fiber.csv) fiber.head(5) #展示下头5条数据信息X fiber.drop([Grade], axis1) Y fiber[Grade]X_train, X_test, y_train, y_test train_test_split(X,Y,train_size0.75,test_size0.25,random_state42,shuffleTrue)print(X_train.shape) #(36,6) print(y_train.shape) #(36,) print(X_test.shape) #(12,6) print(y_test.shape) #(12,)multinomial MultinomialNB(alpha1.2,force_alphaTrue,fit_priorFalse) multinomial.fit(X_train,y_train)y_pred multinomial.predict(X_test) accuracy np.mean(y_predy_test) print(accuracy) score multinomial.score(X_test,y_test)#得分 print(score)test np.array([[16,18312.5,6614.5,2842.31,25.23,1147430.19]]) prediction multinomial.predict(test) print(prediction) #[2]

查看全文

http://www.hkea.cn/news/14363569/