当前位置: 首页 > news >正文

发稿平台seo搜索优化怎么做

发稿平台,seo搜索优化怎么做,做网站的后台用什么开发比较好,百度排行榜小说目录 背景 信息是什么 信息度量 小白鼠实验 哈夫曼编码 密码学 其它应用 背景 克劳德艾尔伍德香农#xff08;Claude Elwood Shannon#xff09;出生于 1916 年 美国密歇根州。1936 年毕业于密歇根大学#xff0c;获得数学和电子工程学士学位。之后#xff0c;他在麻…目录 背景 信息是什么 信息度量 小白鼠实验 哈夫曼编码 密码学 其它应用 背景 克劳德·艾尔伍德·香农Claude Elwood Shannon出生于 1916 年 美国密歇根州。1936 年毕业于密歇根大学获得数学和电子工程学士学位。之后他在麻省理工学院MIT获得数学博士学位和电子工程硕士学位。1941 年他加入贝尔实验室 一直从事研究和教学工作。 香农是一位全才型科学家他在通信技术、信息工程、计算机技术、密码学等方面都作出了巨大的贡献。 香农的主要贡献包括以下几个方面 1信息论香农在1948年发表了关于信息论的经典论文《通信的数学原理》这个理论奠定了现代通信和信息处理的基础。他提出了信息的度量方式用比特bit来表示信息的量并提出了信道容量的概念即信道能够传输的最大信息量。 2香农编码为了有效地传输和存储信息香农提出了多种编码方法其中最著名的是香农-费诺编码和香农-哈夫曼编码。这些编码方法可以使信息的传输更加高效和可靠。 3随机密码系统在第二次世界大战期间香农在贝尔实验室从事密码学研究并设计了一种基于随机数生成器的密码系统被认为是现代密码学的奠基之作。 信息是什么 信息是一段文字、一张图片、一段声音、一种气息等 香农对信息的定义是信息是用来减少随机不确定性的东西。 【例子】我们玩一场猜数字游戏数字在1~8范围内我选择其中一个数字让你来猜我选中的是什么数字。 游戏过程中你可以问我这个数字是否大于、小于或等于某个数字我的回答只有 “是” 或 “否“。 猜测的次数越少得分越高。你会用什么策略来提问 策略1从数字1开始逐个提问是否等于1是否等于2......是否等于8 第一次提问的不确定性是1/8第二次是1/7......第八次是1也就是每提问一次 根据我反馈的信息 “是” 或 “否” 来减少猜测的范围所以不确定性就逐渐减少。 该策略的效率非常低下最坏的情况是结果数字是8这样就要提问7次才能确定正确数字。 策略2每次从中间的数字提问第一次提问是否大于4如果回答是 第二次提问是否小于7如果回答否最后提问是否小于8如果回答是那么可以确定答案是数字7。 该策略只需要提问3次每次提问后都能把数字范围减少一半就可以很好地减少不确定性。 上面例子通过问答方式来获得信息从而消除猜测数字过程中存在的 “不确定性” 所谓的 “不确定性” 表示某事物的发生具有一定的概率所以香农信息属于 “概率信息”。 知道的信息越多随机事件的不确定性就越小。 信息度量 香农厉害的地方是使用统计的方式来量化信息也就是对信息进行度量用来计算某个事件发生的信息量有多少 并用比特bit来表示。 香农把信息定义为是消除不确定性的东西根据人们的一般经验可知 事件发生的概率越小不确定性就越大信息量越大 事件发生的概率越大不确定性就越小信息量越小 概率为 1 的事件的信息量为 0概率为 1 也就是必然事件就像有人告诉你 “今天太阳从东边升起”你一点都不会怀疑。 概率为 0 的事件的信息量为无穷大概率为 0 也就是不可能事件就像有人告诉你 “今天太阳从西边升起”你会感到不可思议。 信息量 用来衡量一条消息所包含的信息量大小。它的概念是基于事件发生的概率来定义的即当一个事件发生的概率较低时它所包含的信息量较大反之亦然。香农信息量的公式如下 其中 I 表示信息量P 表示事件发生的概率。这个公式表示事件发生的概率越低信息量就越大。 该事件发生的信息量应是该事件发生的概率的单调递减函数 如上面猜字游戏的信息量是 -log(1/8) 3 bit也就是说需要 3bit 的信息才能确定正确的数字。 信息熵 是衡量一组消息的平均不确定性的度量。它是对所有可能消息的信息量进行加权平均得到的值其中权重是各个消息发生的概率。香农信息熵的公式如下 其中H表示信息熵Pi 表示第 i 个消息发生的概率n 表示消息的总数。 信息量 表示一个事件或消息所包含的 “不确定性”概率越低信息量越大 信息熵 表示一组消息的 “平均不确定性”概率分布越均匀信息熵越大。 比如抛硬币 1如果正反面概率都是 1/2 I正 -log(1/2) 1 bit I反 -log(1/2) 1 bit H熵 0.5 * 1 0.5 * 1 1 bit 2如果正面概率是 9/10反面概率是 1/10 I正 -log(0.9) 0.15 bit I反 -log(0.1) 3.32 bit H熵 0.9 * 0.15 0.1 * 3.320.78 bit 有些时候在战争中 1 比特的信息能抵过千军万马。 在第二次世界大战中当纳粹德国兵临前苏联莫斯科城下时斯大林在欧洲已经无兵可派而他们在西伯利亚的边界却有60万大军不敢使用因为苏联不知道德国的轴心国盟友日本当时的军事策略是北上进攻苏联还是南下和美国开战。如果是南下苏联就可以放心大胆从亚洲撤回60万大军增援莫斯科会战。事实上日本选择了南下其直接行动就是后来的偷袭珍珠港。但是当时苏联并不知晓斯大林也不能乱猜最后是传奇间谍佐尔格向莫斯科发去了信息量仅 1 比特却价值无限的情报日本将南下。 小白鼠实验 假如实验室里有 1000 只瓶子其中 999 瓶装了普通的水有1瓶装了毒药这瓶毒药无法根据气味或外观分辨出来。如果给小白鼠喝了毒药一天后它就会死亡。假如你只有一天时间请问至少需要几只小白鼠你才能检验出毒药的瓶子 如果我们有1000只小白鼠给每只老鼠喝不同瓶中的水则自然能检测出哪瓶是毒药但这么做的效率不高。 让我们来换一种思路看看用信息编码的方式应该如何考虑这个问题。 让小白鼠喝瓶子中的水结果只会呈现出2种状态要么活着、要么死亡。一只小白鼠可以提供的信息量为 -log(1/2)  1 bit 要从1000个瓶子中选出一瓶毒药相当于需要的信息量为 -log(1/1000)  ≈ 9.97 bit 也就是说我们如果有10只小白鼠提供 10 bit 的信息就能找到那瓶毒药。 检测1000个瓶子居然只要10只小白鼠就够了这不免让人感到惊讶。 具体的操作是这样 我们先把1000个瓶子用1到1000编号这个号码是二进制数也就是说每个瓶子要用10个0或1的数字表示 1号瓶是 0000000001 2号瓶是 0000000010 1000号瓶就是 1111101000 再把小白鼠用1到10来编号。现在我们取出一瓶水查看上面的二进制编号编号上对应位数是1的就给相应编号的小白鼠喝下这瓶水。 从第1瓶开始重复这一动作直到第1000瓶如下 1号瓶的二进制编号是0000000001只有最后一位是1就给10号小白鼠喝下瓶中的水。 2号瓶的二进制编号是0000000010就给9号小白鼠喝水。 1000号瓶的二进制编号是1111101000就要给1、2、3、4、5、7号小白鼠喝下瓶里的水。 一天以后我们根据小白鼠的状态获得一个二进制数0代表生存1代表死亡。 假设1、5、8、9号小白鼠死了这个二进制数就是1000100110换算成十进制是550。 也就是说第550号瓶中装的是毒药。因此 10只小白鼠相当于一组编码它能检测出哪瓶是毒药。 哈夫曼编码 哈夫曼编码是一种用于数据压缩的编码方式它通过将出现频率较高的字符用较短的编码表示 而将出现频率较低的字符用较长的编码表示从而实现对数据进行高效压缩的目的。 如果一本书重复的内容很多它的信息量就小冗余度就大压缩率就高。 假如我们将字符串15位长度BCAADDDCCACACAC 通过转换成ASCII码二进制编码进行传输 那么一个字符传输的二进制位数为 8 bit那么总共需要 120 个二进制位 而如果使用哈夫曼编码该串字符可压缩至 28 位。 具体编码步骤如下 1统计字符串中每个字符的频率 2 按照字符出现的频率进行排序组成一个队列 出现频率最低的在前面出现频率高的在后面 3把这些字符作为叶子节点开始构建一颗哈夫曼树 因此各个字母的编码分别为 在没有经过哈夫曼编码之前字符串 BCAADDDCCACACAC 的二进制为 也就是占了 120 bit 10000100100001101000001010000010100010001000100010001000100001101000011010000010100001101000001010000110100000101000011 编码之后为 占了 28 bit 1000111110110110100110110110 密码学 在二战中日本军方的密码设计就有问题美军破获了日本很多密码。在中途岛海战前美军截获的日军密电经常出现 AF 这样的一个地名应该是太平洋的某个岛屿但是美军无从知道是哪个。于是美军就逐个发布与自己控制的岛屿有关的假新闻。当发出 “中途岛供水系统坏了” 这条假新闻后美军从截获的日军情报中又看到含有 AF 的电文日军情报内容是 AF 供水出了问题于是断定中途岛就是 AF。事实证明判断是正确的美军在那里成功地伏击了日本联合舰队。 香农密码学原理是基于信息不确定性和信息熵的理论用于设计安全的密码系统。 香农密码学原理 信息的不确定性在密码学中我们关注的是如何通过加密方法来保护信息的安全性。香农提出了一个重要的概念即信息的不确定性。不确定性是指在一系列可能性中我们不知道具体是哪一种情况。例如如果一个人告诉你他有一辆车但没有提供任何其他信息你无法确定他具体拥有哪种类型的车。信息熵香农引入了信息熵的概念用来度量信息的不确定性。信息熵越高表示信息的不确定性越大。例如一个硬币正反面各有50%的概率那么猜测硬币正反面的结果就是非常不确定的信息熵也很高。密码学中的应用根据香农密码学原理我们可以利用信息熵来设计安全的密码系统。一个好的密码系统应该具有高的信息熵即使攻击者知道密码的某些信息也无法推断出完整的密码。这是因为密码系统中的密钥和算法会增加信息的不确定性使得攻击者无法轻易猜测出原始信息。密钥长度和安全性根据香农的理论密钥的长度与信息的不确定性直接相关。密钥越长信息熵越高系统的安全性也就越高。因此在设计密码系统时需要选择足够长的密钥长度来保证信息的安全性。 RSA加密 RSA是由三位数学家Rivest、Shamir 和 Adleman 发明的非对称加密算法这种算法非常可靠秘钥越长就越难破解。 目前被破解的最长RSA秘钥是768个二进制位长度超过768位的秘钥还无法破解但随着计算能力的增强以后被破解到多少位还是未知数。就目前而言1024位的秘钥属于基本安全2048位的秘钥属于极其安全。一种加密方法只要保证50年内计算机破解不了就算非常安全可靠了。 RSA是一种非对称加密算法加密和解密使用的不是同一把秘钥公钥加密-私钥解密、私钥加密-公钥解密。 1.公私钥计算逻辑 最后得出 公钥(E, N) 7, 33 私钥(D, N) 3, 33 其中公钥E是对外的如果要反推私钥D那就必须要算出欧拉φ(N) 而算出欧拉φ(N)就必须知道P、Q而如果P、Q设置的比较大 计算出来的欧拉φ(N)和公共模数 N 都会非常巨大所以即使公开N也会很难找到P、Q这个两个质数。 RSA主要依赖于两个大质数的乘积难以分解的特性质数只能被 1 和 自己整除所以它不能分解为质因子其它所有整数都可以分解为质因子。质因子分解的过程就是在消除不确定性这个特性在密码学中很有用这是因为对非常巨大的数来做质因子分解是非常困难的用电脑来计算也要用很长的时间。 2.加解密过程 其它应用 决策树 通过计算每个特征的信息增益可以确定最能有效地划分数据集的特征从而生成更准确的决策树模型。 聚类分析可以使用互信息来评估不同特征或样本之间的相关性从而更好地组织和理解数据。 很多应用有意或无意中遵循信息论搜索引擎的提问、chatgpt的提示词 都是在消除不确定性。 参考 1、《数学之美》、《计算之魂》 2、哈夫曼编码Huffman Coding原理详解_chenyfan_的博客-CSDN博客
http://www.hkea.cn/news/14438322/

相关文章:

  • 织梦做的网站打包在dw修改邯郸市住房和城乡建设网站
  • 中国电力建设集团股份有限公司网站个人如何注册微信公众号怎么创建
  • 北京网站建设备案矢量网站动画怎么做
  • 个体户 建设网站网站代理加盟赚钱吗
  • 怎么做简单的网站首页品牌logo图片设计制作
  • 吴中区做网站linux运维是必死之路
  • 如何快速更新网站快照免费建建网站
  • 做企业网站排名优化要多少钱襄阳电商网站建设
  • 挂机宝做网站站酷网官网进入
  • 网站建设丶金手指下拉13服务质量好的外贸营销系统
  • 网站备案名称规定wordpress后台登陆模板
  • 网站建设完提交百度建设银行福州分行招聘网站
  • 2017wordpress整站源码网站用视频做背景音乐
  • wordpress站点标题是什么建设网站花多少钱
  • 青海网站建设优化wordpress.org 建站
  • 网站建设 长摊 无形资产宣城网站建设费用
  • 服务器网站建设维护网站没备案或与实际备案不符
  • 佛山做外贸网站特色网站技术支持 新锐网络
  • 汕头网站设计定制长沙需要做网站的企业
  • 绵阳做seo网站公司大连市英文网站建设
  • 巴音郭楞库尔勒网站建设大丰网站建设找哪家好
  • 建设企业网站可信度西北旅游攻略
  • 展示型网站重点烟台网站建设询问企汇互联专业
  • 网站营销目标敦化建设局网站
  • layui做移动网站网站解决方案
  • 电商网站构建网站开发需要逻辑吗
  • 成都学校网站制作营销型网站建设怎么做
  • 点击即玩的小游戏网站百度的总部在哪里
  • 嘉鱼网站建设哪家专业网页游戏大全小游戏
  • 网站开发发展趋势2020一建试题