当前位置: 首页 > news >正文

垦利网站制作做网站外链

垦利网站制作,做网站外链,备案 网站服务类型,江苏网站备案流程图For压缩算法 这是倒排表的一种压缩算法。 还是那个问题#xff0c;如果小米 这个词项#xff0c;在多文档里都有#xff0c;则就会导致倒排表很大#xff0c;这时候就会设计到了压缩算法#xff0c;这里说的是#xff0c;倒排表。 那末我们来看看 for压缩… For压缩算法 这是倒排表的一种压缩算法。 还是那个问题如果小米 这个词项在多文档里都有则就会导致倒排表很大这时候就会设计到了压缩算法这里说的是倒排表。 那末我们来看看 for压缩算法是怎么压缩数据呢其实你可以理解为它是将posting list无论数字多大都是用int去存的 转换为一个差值list   deltas list去存的也就是我们之前存的不是文件id吗这回我们去存和前一个的差值这样是不是存的这个数就会变小那这样我们需要的位数是不是就会变小靠这个来压缩我们的函数 不如说上边这个 我们得到一个差值集合之后呢 发现就可以用8位去存储这些数这样是不是跟用int去存储就变小了 但是呢我们又发现 比如 2 这个 数字用8位去存储是不是又浪费了 我们可以在保证顺序的时候去分 在2那分成一半一半把 细心的同学又发现了为什么不把单独的数 拎出来那么分呢2分5字节这不还浪费吗。 但是除了要保证高效的压缩方法还要保证快速的解码啊我们最终还得恢复成最原来的那个倒排表。我们每块数组用了几个数组也是要记录在磁盘上的如果我们一个一个差这会导致这个记录又浪费了空间。这个记录呢占用1个字节 那具体这个数组拆分到什么程度如果这个数组足够稠密的时候就不用拆了就是说这一块的数字特别都比较接近。这个也是动态计算出来的。 RBM压缩算法 如果数值不密集也就是说你一个很大一个很小这时候我们就用RBM压缩算法。 我们这时候就不用减法了我们用除法 因为我们int类型是32位。我们把32位这么看一个高16位商一个低16位余数 所以我们先把每个数除以65536也就是2^16 得到一个除数和一个余数。我们就把一个大数换成了两个小数。 那么这两个数是怎么存储起来的。其实是用Container存的 我们把那个商作为一个key 用short方法去存储 然后余数存在对应key 所对应的容器之中。 如图你就知道了 Container 包括三种container arraycontainer  我们的上述例子就是用的这个容器 Bitmapcontainer  这个占用的空间永远位8kb Runcontainer 这三种容器可以自己去学习
http://www.hkea.cn/news/14291508/

相关文章:

  • 做企业网站选百度云还是阿里云wordpress注入漏洞
  • 网站建设企业公司做零售出口的网站
  • 长沙做网站的包吃包住4000设计一个个人网站的基本步骤
  • 不是网站开发语言的是百度上海推广优化公司
  • 企业网站的种类tk域名官方网站
  • 兰甘肃网站建设seo学徒是做什么
  • 谷歌网站管理员账号网站开发工具js
  • 网站开发前的准备淘宝上做网站可信吗
  • 网站的结构怎么做wordpress淘宝客自适应模板
  • 学做网站的网站藁城区建设局网站
  • 网站建设价格兴田德润i网址多少最新网站开发需求文档
  • 口碑好的坪山网站建设哈尔滨网站建设的公司
  • 国内 上市网站建设公司排名ppt免费下载的网站
  • 培训网站开发流程品牌网站建设c股j东大蝌蚪
  • 网站开发人员 怎么保存制作一个网站多少钱啊
  • yellow片观看完整版网站建设布局利于优化
  • python做网站快么昆山做网站的
  • 潍坊网络推广网站建设wordpress比特币插件
  • 织梦怎么做单页网站医院门户网站模板下载
  • 大良营销网站建设平台帮人家做网站难吗
  • saas建站平台源码有哪些做普洱茶网站的
  • 长沙企业建网站网站域名可以更换吗
  • 球迷类的网站如何做汕头网站推广
  • 网站的 规划与建设wordpress 门户网站源码
  • 手机做直播官方网站o2o最好的平台
  • 企业网站管理系统 才能湖南岚鸿简单房地产网站在哪
  • 远程教育网站建设方案asp.net网站登录
  • 企业内部网站模板下载做网站推荐源创网络
  • 学习网站建设的是什么专业谷歌优化 网站建设
  • 通过一个站点的建设方案十大免费excel网站