当前位置: 首页 > news >正文

营销型网站哪家好怀化找工作网站

营销型网站哪家好,怀化找工作网站,泰安信息港官网,芜湖做网站哪个公司好#x1f436;5.1 hdfs的概念 HDFS分布式文件系统,全称为:Hadoop Distributed File System。 它是一个文件系统#xff0c;用于存储文件#xff0c;通过目录树来定位文件#xff1b;其次#xff0c;它是分布式的#xff0c;由很多服务器联合起来实现其功能#xff0c;集…5.1 hdfs的概念 HDFS分布式文件系统,全称为:Hadoop Distributed File System。 它是一个文件系统用于存储文件通过目录树来定位文件其次它是分布式的由很多服务器联合起来实现其功能集群中的服务器有各自的角色。 HDFS的使用场景适合一次写入多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变。 我一共三台linux服务器每台机器内存60G所以HDFS文件系统之和为180G 5.2 为什么要用hdfs: 因为随着数据量越来越大,一台机器已经不能满足当前数据的存储,如果使用多台计算机进行存储,虽然解决了数据的存储问题,但是后期的管理和维护成本比较高,因为我们不能精准的知道哪台机器上存储了什么样的数据,所以我们迫切的需要一个能够帮助我们管理多台机器上的文件的一套管理系统,这就是分布式文件系统的作用,而hdfs就是这样的一套管理系统,而且他也只是其中的一种. 5.3 hdfs的优缺点 5.3.1 优点: 1. 高容错性: 数据自动保存多个副本。它通过增加副本的形式提高容错性。 某一个副本丢失以后它可以自动恢复。 2. 高扩展性: 当HDFS系统的存储空间不够时,我们只需要添加一台新的机器到当前集群中即可完成扩容,这就是我们所说的横向扩容,而集群的存储能力,是按照整个集群中的所有的机器的存储能力来计算的,这也就是我们所说的高扩容性 3. 适合处理大数据: 数据规模能够处理数据规模达到GB、TB、甚至PB级别的数据。 文件规模能够处理百万规模以上的文件数量数量相当之大。 5.3.2 缺点: 1. 不适合低延时数据访问 比如毫秒级的来存储数据这是不行的它做不到。 它适合高吞吐率的场景就是在某一时间内写入大量的数据。但是它在低延时的情况 下是不行的比如毫秒级以内读取数据这样它是很难做到的。 2. 无法高效的对大量小文件进行存储 存储大量小文件的话它会占用NameNode大量的内存来存储文件、目录和块信息。这样是不可取的因为NameNode的内存总是有限的。 小文件存储的寻址时间会超过读取时间它违反了HDFS的设计目标。 3. 不支持并发写入、文件随机修改 一个文件只能有一个写不允许多个线程同时写。 仅支持数据 append追加不支持文件的随机修改。 5.4 HDFS架构 HDFS是一个主/从Master/Slave)体系结构,架构中有三个角色:一个叫NameNode,一个叫DataNode,还有一个叫secondaryNameNode 主从架构示例图: 所以我们在搭建hdfs架构时,需要一台NameNode,三台DataNode,一台SecondaryNameNode. 1. NameNode 主要负责存储文件的元数据,比如集群id,文件存储所在的目录名称,文件的副本数,以及每个文件被切割成块以后的块列表和块列表所在的DataNode。 1管理HDFS的名称空间。 2配置副本策略 3管理数据块Block)映射信息。 2. DataNode 负责管理用户的文件数据块每一个数据块都可以在多个 DataNode 上存储多个副本默认为3个。 1存储实际的数据块 2执行数据块的读/写操作 NameNode DataNode 存储元数据 存储文件内容 元数据保存在内存中 文件内容保存在磁盘 保存文件、block、DataNode之间的映射关系 维护了block id到DataNode本地文件的映射关系 3. SecondaryNameNode 并非NameNode的热备。当NameNode挂掉的时候它并不能马上替换NameNode并提供服务。 1辅助NameNode,分担其工作量比如定期合并Fsimage和Edits,并推送给NameNode; 2) 在紧急情况下可辅助恢复NameNode. 4. Client:就是客户端 1文件切分。文件上传HDFS的时候client将文件切分成一个一个的block然后进行上传。 2与namenode交互获取文件的位置信息 3与datanode交互读取或者写入数据。 4Client提供一些命令来管理HDFS,比如NameNode格式化 5Client可以通过一些命令来访问HDFS,比如对HDFS增删查改操作。 5.5 HDFS文件块大小(面试题 HDFS中的文件在物理上是分块存储Block), 块的大小可以通过配置参数dfs blocksize)来规定默认大小在Hadoop2x/3x版本中是128M,1x版本中是64M. 问题:能不能将块设置的小一些? 理论上是可以的,但是如果设置的块大小过小,会占用大量的namenode的元数据空间,而且在读写操作时,加大了寻址时间,所以不建议设置的过小 问题:不能过小,那能不能过大? 不建议,因为设置的过大,传输时间会远远大于寻址时间,增加了网络资源的消耗,而且如果在读写的过程中出现故障,恢复起来也很麻烦,所以不建议 总结HDFS块的大小设置主要取决于磁盘传输速率。
http://www.hkea.cn/news/14449972/

相关文章:

  • 高创园网站建设方案网络营销哪家比较专业
  • 个人网站怎么写江苏金地建设工程有限公司网站
  • 怎么把自己的网站放到百度搜索上深圳模板建站代理
  • 上海小企业网站建设平台做网站用微软雅黑侵权吗
  • 网站建设技术培训学校深圳宝安区属于富人区吗
  • 已有网站备案网站数据分析平台
  • 高中做信息技术题网站优秀品牌设计案例分析
  • 泗水县城乡建设局网站wordpress 文章 图片 插件
  • 特效网站淘客网站建设要求
  • 天津企业模板建站哪个好做建材上哪个网站比较好
  • 自助建站网站seo公司保定专业网站建设公司
  • 厦门同安网站建设淘宝买cdk自己做网站
  • 云服务器怎么建立网站wordpress e-commerce themes
  • 南平网站建设购物网站开题报告
  • asp 免费网站模板逻辑网络设计报告
  • 宝山专业网站建设六安哪家公司做网站好
  • 餐饮酒店网站怎么做vue前端可视化开发工具
  • 网站不备案可以做百度竞价吗wordpress 注册邮箱
  • 猎头做单都有什么网站重庆平台网站建设多少钱
  • 重庆英文网站建设网站logo用什么来做
  • 网站设计精美案例浙里建官网登录
  • 垫江集团网站建设个人网站可以放广告吗
  • 成都私人定制旅游公司排名深度优化
  • 重庆哪里可以做网站的为网站设计手机版
  • 襄樊北京网站建设关于网站建设外文文献
  • 做教案找资料有哪些网站dz网站建设教程
  • 网站开发语言版本不同鞍山新款网站制作哪家好
  • 网站不兼容360浏览器服装设计最好的出路
  • ui设计师面试seo最新快速排名
  • 专业做网站公司怎么样网页设计师证书什么时候考