当前位置: 首页 > news >正文

聊天网站建设代做毕业设计找哪个网站

聊天网站建设,代做毕业设计找哪个网站,嵌入式软件开发有哪些,国内免费建站网站目录1、背景介绍2、朴素贝叶斯2.1 模型介绍2.2 模型实现3、人工神经网络1、背景介绍 目标#xff1a;将根据用户产生的数据对课程潜在的会员用户#xff08;可能产生购买会员的行为#xff09;进行预测。 平台的一位注册用户是否购买会员的行为应该是建立在一定背景条件下… 目录1、背景介绍2、朴素贝叶斯2.1 模型介绍2.2 模型实现3、人工神经网络1、背景介绍 目标将根据用户产生的数据对课程潜在的会员用户可能产生购买会员的行为进行预测。 平台的一位注册用户是否购买会员的行为应该是建立在一定背景条件下。相信很少有用户刚刚完成注册不久就直接购买会员。 一般来讲促使付费行为发生的原因往往都建立在用户的活跃度之上。 数据 !wget -nc “http://labfile.oss.aliyuncs.com/courses/764/data_10.zip” !unzip -o “data_10.zip” 训练数据集包含有 8 个特征项以及用户是否为会员的标签数据共计 40000 条。 最后一项会员标签通过布尔值进行标识。True 当前用户是会员身份False 代表当前用户不是会员身份。 import pandas as pdpd.read_excel(user_fit.xlsx).head()测试数据集包含 10000 条数据且数据特征项与训练数据集完全一致。唯一不同的地方在于训练数据集中既有会员数据也有非会员数据而测试数据集中全部都为非会员用户。 pd.read_excel(user_prediction.xlsx).head()**目标**预测测试集中这些用户哪些是潜在用户很可能购买会员的 这些数据已经是处理好的没有缺失值的数据 2、朴素贝叶斯 2.1 模型介绍 朴素贝叶斯是一种可用于构建分类模型的方法他是假设特征相互独立的情况下运用贝叶斯定理进行后验概率计算的简单分类器。 贝叶斯公式 数据集拥有 8 个特征值分别为用户的注册时间、用户的学习时间 用户实验豆数量、学习的课程数量、学习的实验数量、学习训练营数量 用户的提问数量、用户的评论数量。这些特征之间是相互独立的。 而这些特征可能会对最后的目标参数也就是该用户是否为会员造成影响。也就是说如果我们现在有一个会员的数据我们知道他的 8 个特征取值最后想了解他成为会员的概率有多大 根据贝叶斯定理且特征之间相互独立得到 像 P(用户的注册时间)P(用户的注册时间) 这样的概率怎样求解呢由于我们这里是连续变量一般会针对其进行离散化处理也就是通过假定一个区间计算变量落在该区间内的概率。 最后我们就可以计算出该用户是会员和不是会员的概率通过比较得出分类属性。 2.2 模型实现 直接使用 scikit-learn 提供的贝叶斯算法来构建模型 scikit-learn 针对朴素贝叶斯提供了三种分类器分别是 高斯分布朴素贝叶斯分类器 naive_bayes.GaussianNB多项式分布朴素贝叶斯分类器 naive_bayes.MultinomialNB伯努利分布朴素贝叶斯分类器 naive_bayes.BernoulliNB 其中高斯分布模型常用于特征值为连续型变量的数据集中例如本实验中的数据集。高斯模型的特点在于它通常假设是这些连续数值为高斯分布相比于直接把连续变量离散化的方法更优。 伯努利模型常用处理特征变量为布尔值类型的数据集 多项式模型常用于文本分类。 尝试使用高斯分布朴素贝叶斯针对 user_fit.xlsx 数据集构建一个分类模型 from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB# 使用 Pandas 读取数据 df_fit pd.read_excel(user_fit.xlsx, header0) # 特征 X df_fit.iloc[:, 0:8] # 目标 y df_fit[用户是否为会员] # 安装 3:7 切分验证集和训练集 X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.3) X_train.shape, X_test.shape, y_train.shape, y_test.shape# 构建高斯贝叶斯分类器 model_GaussianNB GaussianNB() # 使用训练集训练模型 model_GaussianNB.fit(X_train, y_train) # 使用验证集评估准确度 model_GaussianNB.score(X_test, y_test)91%的准确率可以接受下面继续训练模型并且保存为二进制文件 from sklearn.externals import joblibmodel_GaussianNB.fit(X, y) # 保存模型 joblib.dump(model_GaussianNB, model_GaussianNB.pkl)将该模型去评估 user_prediction.xlsx 非会员数据集中潜在会员用户的概率 # 使用 Pandas 读取数据 df_pred pd.read_excel(user_prediction.xlsx, header0) # 特征 X_pred df_pred.iloc[:, 0:8] # 加载模型 model_GaussianNB joblib.load(model_GaussianNB.pkl) # 返回预测概率% results model_GaussianNB.predict_proba(X_pred) * 100 resultsimport numpy as np # 将预测概率转换为 DataFrame results_df pd.DataFrame(np.around(results, 2), columns[非会员概率, 会员概率]) # 将预测概率添加到原数据集中最后一列 df_merged pd.concat([df_pred.drop(用户是否为会员, axis1), results_df[会员概率]], axis1) df_merged.sort_values(by会员概率, ascendingFalse)可以看到 DataFrame 最后一列已经添加了我们预测某位用户是潜在会员用户的概率。可以针对概率排序将大于 50%的用户筛选出来对这些潜在会员用户给予重点关照。 3、人工神经网络 除了使用高斯贝叶斯分类器还可以使用人工神经网络来进行预测 同样首先拿 user_fit.xlsx 看一看神经网络模型的分类效果 from sklearn.neural_network import MLPClassifier# 构建神经网络分类器 model_MLPClassifier MLPClassifier(activationlogistic, max_iter1000, hidden_layer_sizes(50, 50, 50)) # 使用训练集训练模型 model_MLPClassifier.fit(X_train, y_train) # 使用验证集评估准确度 score_trainset model_MLPClassifier.score(X_train, y_train)*100 score_testset model_MLPClassifier.score(X_test, y_test)*100print(训练集预测准确率%.2f%% % score_trainset) print(测试集预测准确率%.2f%% % score_testset)使用最常见的 logistic 激活函数建立一个含 3 个隐含层每层 50 个神经元的网络。由于迭代次数较多在线上实验环境中运行时间较长你也可以调低数值用于测试。 使用全部数据进行训练对非会员数据进行概率预测 model_MLPClassifier.fit(X, y) # 返回预测概率% results model_MLPClassifier.predict_proba(X_pred) * 100 # 将预测概率转换为 DataFrame results_df pd.DataFrame(np.around(results, 2), columns[非会员概率, 会员概率]) # 将预测概率添加到原数据集中最后一列 df_merged pd.concat([df_pred.drop(用户是否为会员, axis1), results_df[会员概率]], axis1) # 按会员概率降排序 df_merged.sort_values(by会员概率, ascendingFalse)
http://www.hkea.cn/news/14368979/

相关文章:

  • 天津网站优化哪家好鹤壁市城乡一体化示范区规划图
  • 旅游网站技术方案河南省建设工会网站
  • 互联网营销工具有哪些优化百度百科
  • 做正规小说网站外贸类网站建设
  • 鄂州市城市建设档案馆网站深圳ui设计师招聘
  • 福州定制网站开发制作微信公众号文章怎么制作
  • 做网站彩票代理多少钱啊爱眼护眼ppt模板免费下载 素材
  • 深圳石岩建网站盐城网站开发公司电话
  • 北京云建站模板推广策略是什么
  • 网站发布新闻的好处 seo怎么给网站做优化
  • 深圳企业网站制作公司介绍做任务的网站源码
  • 买卖平台青岛神马排名优化
  • 网站整站优化推广方案使用局域网可以做网站吗
  • 有哪些网站是可以做会计题目的嘉兴网站建设费用
  • 龙华做棋牌网站建设找哪家效益快网站怎么制作商城
  • 普陀手机网站建设纺织面料做哪个网站好
  • 南京网站推广营销公司哪家好程序小程序开发公司
  • 江苏省义务教育标准化建设网站主营网站建设会计记账
  • 网站备案复查 手机号码打不通哇哈哈网站建设策划书
  • 珠海自适应网站建设c2c网站类型
  • 做音频的网站屯溪网站建设
  • 江苏分销网站建设建设部工程业绩网站
  • 网站 留言板 制作wordpress 更换字体
  • 南通网站定制哪家好app线下推广怎么做
  • 了解当前各类网站建设价格网站备案符号
  • 万全网站建设wl17581网页制作软件是应用软件吗
  • 重庆做木门网站公司如何购买域名和空间
  • 市场监督局网站电子签名怎么做泰安有什么好的网络科技公司
  • 企业站群系统wordpress赞的代码
  • 做网站找个人还是找公司超实用网站