当前位置: 首页 > news >正文

山东住房建设部网站做第三方库个人网站

山东住房建设部网站,做第三方库个人网站,网站域名设计,visual studio 2010 网站开发教程KL 散度#xff0c;是一个用来衡量两个概率分布的相似性的一个度量指标。 现实世界里的任何观察都可以看成表示成信息和数据#xff0c;一般来说#xff0c;我们无法获取数据的总体#xff0c;我们只能拿到数据的部分样本#xff0c;根据数据的部分样本#xff0c;我们会…KL 散度是一个用来衡量两个概率分布的相似性的一个度量指标。 现实世界里的任何观察都可以看成表示成信息和数据一般来说我们无法获取数据的总体我们只能拿到数据的部分样本根据数据的部分样本我们会对数据的整体做一个近似的估计而数据整体本身有一个真实的分布我们可能永远无法知道。 那么近似估计的概率分布和数据整体真实的概率分布的相似度或者说差异程度可以用 KL 散度来表示。 KL 散度最早是从信息论里演化而来的。所以在介绍 KL 散度之前先介绍一下信息论里有关熵的概念。 熵 信息论中某个信息 xi\large x_{i}xi​ 出现的不确定性的大小定义为 xi\large x_{i}xi​ 所携带的信息量用 I(xi)I(x_{i})I(xi​) 表示。I(xi)I(x_{i})I(xi​) 与信息 xi\large x_{i}xi​ 出现的概率 P(xi)P(x_{i})P(xi​) 之间的关系为 I(xi)log1P(xi)−logP(xi)(1)\begin{aligned} I(x_i) log\frac{1}{P(x_i)} -logP(x_i) \tag{1} \\ \end{aligned} I(xi​)​logP(xi​)1​−logP(xi​)​(1) 例掷两枚骰子求点数和为7的信息量 点数和为7的情况为(1,6) ; (6,1) ; (2,5) ; (5,2) ; (3,4) ; (4,3) 这6种。总的情况为 6*6 36 种。 那么该信息出现的概率为 Px763616P_{x7}\frac{6}{36}\frac{1}{6}Px7​366​61​ 包含的信息量为 I(7)−log⁡P(7)−log⁡16log⁡6I(7)-\log P(7)-\log\frac{1}{6}\log 6I(7)−logP(7)−log61​log6 以上是求单一信息的信息量。但实际情况中会要求我们求多个信息的信息量也就是平均信息量。 假设一共有 n 种信息每种信息出现的概率情况由以下列出 X1X_1X1​X2X_2X2​X3X_3X3​X4X_4X4​...............XnX_nXn​P(x1)P(x_1)P(x1​)P(x2)P(x_2)P(x2​)P(x3)P(x_3)P(x3​)P(x4)P(x_4)P(x4​)…P(xn)P(x_n)P(xn​) 同时满足 ∑i1nP(xi)1(2)\begin{aligned} \sum^n_{i1} P(x_i) 1 \tag{2} \\ \end{aligned} i1∑n​P(xi​)1​(2) 则 x1,x2,.....,xnx_1,x_2,.....,x_nx1​,x2​,.....,xn​ 所包含的信息量分别是 KaTeX parse error: Undefined control sequence: \logP at position 2: -\̲l̲o̲g̲P̲(x_1),-\logP(x_…平均信息量为 KaTeX parse error: Undefined control sequence: \logP at position 49: …^n_{i1} P(x_i)\̲l̲o̲g̲P̲(x_i) \tag{3} \… H 与热力学中的熵的定义类似故这又被称为信息熵。 与热力学中的熵的定义类似故这又被称为信息熵。 H(x)−(18log⁡(18)18log⁡(18)14log⁡(14)12log⁡(12))1.75\begin{aligned}H(x) -(\frac{1}{8}\log(\frac{1}{8}) \frac{1}{8}\log(\frac{1}{8}) \frac{1}{4}\log(\frac{1}{4}) \frac{1}{2}\log(\frac{1}{2}) ) 1.75 \end{aligned}H(x)−(81​log(81​)81​log(81​)41​log(41​)21​log(21​))1.75​ 连续信息的平均信息量可定义为 H(x)−∫f(x)log⁡f(x)dx(3)\begin{aligned} H(x) -\int f(x)\log f(x)dx \tag{3} \end{aligned} H(x)−∫f(x)logf(x)dx​(3) 这里的 f(x)f(x)f(x) 是信息的概率密度。 上述我们提到了信息论中的信息熵 H(x)−∑i1nP(xi)log⁡P(xi)∑i1nP(xi)log⁡1P(xi)H(P)(4)\begin{aligned} H(x) -\sum^n_{i1}P(x_i) \log P(x_i) \sum^n_{i1} P(x_i) \log \frac{1}{P(x_i)} H(P) \tag{4} \end{aligned} H(x)−i1∑n​P(xi​)logP(xi​)i1∑n​P(xi​)logP(xi​)1​H(P)​(4) 这是一个平均信息量又可以解释为用基于P的编码去编码来自P的样本其最优编码平均所需要的比特个数 接下来我们再提一个概念交叉熵 H(P,Q)−∑i1nP(xi)log⁡Q(xi)∑i1nP(xi)log⁡1Q(xi)(6)\begin{aligned} H(P,Q) -\sum^n_{i1}P(x_i) \log Q(x_i) \sum^n_{i1} P(x_i) \log \frac{1}{Q(x_i)} \tag{6} \end{aligned} H(P,Q)−i1∑n​P(xi​)logQ(xi​)i1∑n​P(xi​)logQ(xi​)1​​(6) 这就解释为用基于P的编码去编码来自Q的样本所需要的比特个数 【注】P(x)P(x)P(x) 为各字符出现的频率log⁡1P(x)\log \frac{1}{P(x)}logP(x)1​ 为该字符相应的编码长度log⁡1Q(x)\log \frac{1}{Q(x)}logQ(x)1​ 为对应于Q 的分布各字符编码长度。 KL 散度 让我们从一个问题开始我们的探索。假设我们是太空科学家正在访问一个遥远的新行星我们发现了一种咬人的蠕虫我们想研究它。我们发现这些蠕虫有10颗牙齿但由于它们不停地咀嚼很多最后都掉了牙。在收集了许多样本后我们得出了每条蠕虫牙齿数量的经验概率分布: 虽然这些数据很好但我们有一个小问题。我们离地球很远把数据寄回家很贵。我们要做的是将这些数据简化为一个只有一两个参数的简单模型。一种选择是将蠕虫牙齿的分布表示为均匀分布。我们知道有11个可能的值我们可以指定1/11的均匀概率 显然我们的数据不是均匀分布的但是看起来也不像我们所知道的任何常见分布。我们可以尝试的另一种选择是使用二项分布对数据进行建模。在这种情况下我们要做的就是估计二项分布的概率参数。我们知道如果我们有n次试验概率是p那么期望就是E[x] np。在本例中n 10期望值是我们数据的平均值计算得到5.7因此我们对p的最佳估计为0.57。这将使我们得到一个二项分布如下所示 将我们的两个模型与原始数据进行比较我们可以看出两个都没有完美匹配原始分布但是哪个更好 现如今有许多错误度量标准但是我们主要关注的是必须使发送的信息量最少。这两个模型都将我们的问题所需的参数量减少。最好的方法是计算分布哪个保留了我们原始数据源中最多的信息。这就是Kullback-Leibler散度的作用。 KL散度又可称为相对熵描述两个概率分布 P 和 Q 的差异或相似性用 DKL(P∣∣Q)D_{KL}(P\left | \right |Q)DKL​(P∣∣Q) 表示 DKL(P∣∣Q)H(P,Q)−H(P)∑iP(xi)log⁡1Q(xi)−∑iP(xi)log⁡1P(xi)∑iP(xi)log⁡P(xi)Q(xi)(7)\begin{aligned} D_{KL}(P || Q) H(P,Q) - H(P) \\ \sum_i P(x_i) \log \frac{1}{Q(x_i)} - \sum_i P(x_i) \log \frac{1}{P(x_i)} \\ \sum_i P(x_i) \log \frac{P(x_i)}{Q(x_i)} \tag{7} \\ \end{aligned} DKL​(P∣∣Q)​H(P,Q)−H(P)i∑​P(xi​)logQ(xi​)1​−i∑​P(xi​)logP(xi​)1​i∑​P(xi​)logQ(xi​)P(xi​)​​(7) 很显然散度越小说明概率 Q 与概率 P 之间越接近那么估计的概率分布与真实的概率分布也就越接近。 KL散度的性质 非对称性DKL(P∣∣Q)≠DKL(Q∣∣P)D_{KL}(P || Q) \neq D_{KL}(Q || P)DKL​(P∣∣Q)DKL​(Q∣∣P)DKL(P∣∣Q)≥0D_{KL}(P || Q) \geq 0DKL​(P∣∣Q)≥0仅在 PQ时等于0 性质2是很重要的可以用 Jensen 不等式证明。 Jensen 不等式与凸函数是密切相关的。可以说 Jensen 不等式是凸函数的推广而凸函数是 Jensen 不等式的特例。
http://www.hkea.cn/news/14350970/

相关文章:

  • 商城用什么系统做网站flash网站建设技术精粹
  • 网站建设开发哪个好学谁有手机网站
  • 做网站用小公司还是大公司好网站建设的工具
  • 如何开发高端客户裤子seo优化标题
  • 苏州园区建设网站首页短链接转换工具
  • 潍坊程序设计网站建设公司公众号制作开发公司
  • 模板网站和定制网站的区别如何做代刷网站
  • 大连网站如何制作成品网页大全下载
  • 网站开发要营销策略研究论文范文
  • 不通过第三方平台做微网站宝塔一键wordpress
  • 彩票网站代理怎么做深圳市宝安区中心医院
  • 网站导航栏自适应显示南京网站开发联系南京乐识
  • 龙岗住房建设局网站qq登录账号在线登录入口
  • 抚州建设工程造价管理站网站建设网站容易吗
  • 网站提取规则怎么设置简历制作专业机构
  • 网站文件权限设置网站做电商资质
  • 罗湖网站制作公司网页设计的工作流程
  • 做网站需要哪几个板块网站建设与推广综合实训报告册
  • 做百度网站需不需要备案后台网站建设招聘
  • 网站建设的多吗网页设计图片叠加
  • 怎样查找网站域名网站的封面怎么做
  • 重庆深蓝科技网站开发网络营销第三版课本
  • 杭州pc网站开发公司有哪些众筹wordpress模板
  • 上海建筑安全协会网站建筑人才网上传不了论文
  • 只做健康产品的网站网站安装步骤页面
  • 建站公司合肥网站微信支付怎么做的
  • 公司网站设计 上海去了外包公司就毁了吗
  • 三门峡集团网站建设驻马店网站建设熊掌号
  • 网站数据库是谁提供做网站建设哪家效益快
  • 西安做网站公司必达wordpress 优化设置