当前位置: 首页 > news >正文

做网站创业需要注册公司吗湘西州住房和城乡建设局网站

做网站创业需要注册公司吗,湘西州住房和城乡建设局网站,晋州网站建设哪家好,东阳网络推广目录 一、贝叶斯方法 背景知识 贝叶斯公式 二、朴素贝叶斯原理 判别模型和生成模型 1#xff0e;朴素贝叶斯法是典型的生成学习方法 2#xff0e;朴素贝叶斯法的基本假设是条件独立性 3#xff0e;朴素贝叶斯法利用贝叶斯定理与学到的联合概率模型进行分类预测 用于文…目录 一、贝叶斯方法 背景知识 贝叶斯公式 二、朴素贝叶斯原理 判别模型和生成模型 1朴素贝叶斯法是典型的生成学习方法 2朴素贝叶斯法的基本假设是条件独立性 3朴素贝叶斯法利用贝叶斯定理与学到的联合概率模型进行分类预测 用于文本分类的朴素贝叶斯模型 三、朴素贝叶斯案例 四、朴素贝叶斯代码实现 一、贝叶斯方法 背景知识 贝叶斯分类贝叶斯分类是一类分类算法的总称这类算法均以贝叶斯定理为基础故统称为贝叶斯分类。先验概率根据以往经验和分析得到的概率。我们用P(Y)来代表在没有训练数据前假设Y拥有的初始概率。后验概率根据已经发生的事件来分析得到的概率。以P(Y|X)代表假设X 成立的情下观察到Y数据的概率因为它反映了在看到训练数据X后Y成立的置信度。联合概率联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。X与Y的联合概率表示为P(X,Y)、 P(XY) 或P(X∩Y) 。假设X和Y都服从正态分布那么P(X5,Y0)就是一个联合概率表示 X5,Y0两个条件同时成立的概率。表示两个事件共同发生的概率。 贝叶斯公式 朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布 P(X,Y)然后求得后验概率分布P(Y|X)。 学习联合概率的方法利用训练数据学习P(X|Y)的估计与先验的P(Y)相乘得到    P(X,Y)P(X|Y) P(Y) 二、朴素贝叶斯原理 判别模型和生成模型 监督学习方法又分 生成方法Generative approach和判别方法Discriminative approach 所学到的模型分别称为 生成模型Generative Model和判别模型Discriminative Model)。 1朴素贝叶斯法是典型的生成学习方法 生成方法由训练数据学习联合概率分布 P(X,Y)然后求得后验概率分布P(Y|X)。具体来说利用训练数据学习P(X|Y)和P(Y)的估计得到联合概率分布 概率估计方法可以是极大似然估计或贝叶斯估计。 2朴素贝叶斯法的基本假设是条件独立性 c_k代表类别k代表类别序号。 这是一个较强的假设。由于这一假设朴素贝叶斯法的学习与预测大为简化。因而朴素贝叶斯法高效且易于实现。其缺点是分类的性能不一定很高。 3朴素贝叶斯法利用贝叶斯定理与学到的联合概率模型进行分类预测 我们要求的是P(Y|X)根据生成模型定义我们可以求P(X,Y)和P(Y)。 这个称作朴素贝叶斯假设条件独立形式化表示为给定Z的情况下X、Y条件独立 也可以表示为 用于文本分类的朴素贝叶斯模型 首先随机选定了邮件的类型y垃圾邮件或普通邮件然后一个人翻遍词典的所有词依照概率p(x^(i)|y)随机决定一个词是否出现出现标示为1否则标示为0 。假设有50000个单词那么这封邮件的概率可以表示为 联合概率将输入x分到联合概率最大的类 y ̂ : 三、朴素贝叶斯案例 假设我们正在构建一个分类器该分类器说明文本是否与运动(Sports)有关。我们的训练数据有5句话 我们想要计算句子“A very close game”是 Sports 的概率以及它不是 Sports 的概率。 P( Sports | a very close game ) 即这个句子的类别是Sports的概率  特征单词的频率 已知贝叶斯定理则 由于我们只是试图找出哪个类别有更大的概率可以舍弃除数只是比较 我们假设一个句子中的每个单词都与其他单词无关。 计算每个类别的先验概率 对于训练集中的给定句子P(Sports )的概率为⅗。P(Not Sports )是⅖。  然后再计算P(game│Sports)就是“game”有多少次出现在Sports的样本然后除以sports为标签的文本的单词总数33511。 因此P(game│Sports)2/11。 “close”不会出现在任何sports样本中那就是说P(close│Sports)0。 通过使用一种称为拉普拉斯平滑的方法我们为每个计数加1因此它永远不会为零。为了平衡这一点我们将可能单词的数量添加到除数中因此计算结果永远不会大于1且保证了最终和为1的概率性质。 在这里的情况下可能单词是[a, great, very, over, it, but, game, election, clean, close, the, was, forgettable, match]。 由于可能的单词数是14因此应用平滑处理可以得到 P( game | sports )21/1114 拉普拉斯平滑是一种用于平滑分类数据的技术。引入拉普拉斯平滑法来解决零概率问题,通过应用此方法,先验概率和条件概率可以写为 其中K表示类别数量A表示a_j中不同值的数量通常λ1 加入拉普拉斯平滑之后避免了出现概率为0的情况又保证了每个值都在0到1的范围内又保证了最终和为1的概率性质。 四、朴素贝叶斯代码实现 最常用的GaussianNB是高斯贝叶斯分类器。它假设特征的条件概率分布满足高斯分布 其他贝叶斯分类器 MultinomialNB是多项式贝叶斯分类器它假设特征的条件概率分布满足多项式分布BernoulliNB是伯努利贝叶斯分类器。它假设特征的条件概率分布满足二项分布。 GaussianNB是高斯朴素贝叶斯分类器的scikit-learn实现。 GaussianNB是高斯朴素贝叶斯分类器的Numpy实现。
http://www.hkea.cn/news/14420411/

相关文章:

  • 房地产微网站模板深圳建网站公司
  • 网站安全注意哪些问题吗网站前台模板下载
  • 软件网站排名潍坊网站制作厂家
  • 外贸 网站设计公司网站的服务器
  • 寻找在山西运城专业做网站推广的峨眉山网站建设
  • 西昌城乡建设网站网站开发会员功能教程
  • 六盘水住房和城乡建设部网站网站建设120
  • 如何在网站页面做标注wordpress添加flash
  • 单页面网站 seo17网站一起做网店白沟
  • 深圳做分销网站的公司logoko
  • 西安网站建设的网站如何修改管理网站
  • 欧美网站建设公司排名物流公司上门取大件托运
  • 腾讯云 wordpress建站做移动网站快速排
  • 浙江网站备案流程烟台学校网站建设
  • 滨州建网站仿牌网站空间
  • 北京专业企业营销网站建设陵水媒体建站哪家好
  • 网站 建设 步骤阿里巴巴吧网站怎么做
  • 轻淘客cms建站教程网站开发技术招聘
  • 网站后台编程语言网络营销就是
  • 房产网站开发文档怎么给一个网站做seo
  • 上海网站建设电免费的编程软件下载
  • 阜阳制作网站公司建设电影网站算盗版吗
  • 最少的钱怎么做网站做网站要考虑的
  • pc网站优化排名毕设DW做网站的过程
  • 青岛网站建设迅优长春网站制作建设
  • 律师个人网站源码win7网站服务器制作软件
  • 北京大兴地区网站建设电商美工培训机构
  • 淘宝导购网站模板制作网页时通常用表格进行页面布局
  • 推广型网站开发网址门户网站平台建设情况
  • 福州seo网站推广优化梦幻西游网页版下载