当前位置: 首页 > news >正文

东莞化工网站建设注册网站一年多少钱

东莞化工网站建设,注册网站一年多少钱,大连开发区做网站的公司,赣州市住房和城乡建设局网站1. Spark RDD是什么 RDD#xff08;Resilient Distributed Dataset#xff0c;弹性分布式数据集#xff09;是一个不可变的分布式对象集合#xff0c;是Spark中最基本的数据抽象。在代码中RDD是一个抽象类#xff0c;代表一个弹性的、不可变、可分区、里面的元素可并行计… 1. Spark RDD是什么 RDDResilient Distributed Dataset弹性分布式数据集是一个不可变的分布式对象集合是Spark中最基本的数据抽象。在代码中RDD是一个抽象类代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 每个RDD都被分为多个分区这些分区运行在集群中的不同节点上。RDD可以包含Python、Java、Scala中任意类型的对象甚至可以包含用户自定义的对象。RDD的转化操作都是惰性求值的所以我们不应该把RDD看作存放着特定数据的数据集而最好把每个RDD当作我们通过转化操作构建出来的、记录如何计算数据的指令列表。 RDD表示只读的分区的数据集对RDD进行改动只能通过RDD的转换操作由一个RDD得到一个新的RDD新的RDD包含了从其他RDD衍生所必需的信息。RDD之间存在依赖RDD的执行是按照依赖关系延时计算的。如果依赖关系较长那么可以通过持久化RDD来切断依赖关系。RDD逻辑上是分区的每个分区的数据抽象存在计算的时候会通过一个compute函数得到每个分区的数据。如果RDD是通过已有的文件系统构建的那么compute函数读取指定文件系统中的数据如果RDD是通过其他RDD转换而来的那么compute函数将首先执行转换逻辑也就是将其他RDD的数据进行转换[yx1] [2] 。 2. RDD的主要属性 RDD的主要属性如下 1A list of partitions多个分区。 分区可以看作数据集的基本组成单位。对于RDD来说每个分区都会被一个计算任务处理并决定了并行计算的粒度。用户可以在创建RDD时指定RDD的分区数如果没有指定就会采用默认值。默认值就是程序所分配到的CPU Core的数目。每个分配的存储是由BlockManager实现的。每个分区都会被逻辑映射成BlockManager的一个Block而这个Block会被一个task负责计算。 2A function for computing each split计算每个切片分区的函数。 Spark中RDD的计算是以分区为单位的每个RDD都会实现compute函数以达到这个目的。 3A list of dependencies on other RDDs与其他RDD之间的依赖关系。 RDD的每次转换都会生成一个新的RDD所以RDD之间会形成类似于流水线一样的前后依赖关系。在部分分区数据丢失时Spark可以通过这个依赖关系重新计算丢失的分区数据而不是对RDD的所有分区进行重新计算。 4Optionallya Partitioner for key-value RDDs (e.g. to say that the RDD is hash-partitioned) 对存储键-值对的RDD来说还有一个可选的分区器。只有存储键-值对的RDD才会有分区器没有存储键-值对的RDD其分区器的值是None。分区器不但决定了RDD的本区数量也决定了父RDDShuffle[yx3] [4] 输出时的分区数量。 5Optionallya list of preferred locations to compute each split on (e.g. block locations for an HDFS file)存储每个切片优先位置的列表。 比如对于一个HDFS文件来说这个列表保存的就是每个分区所在文件块的位置。按照“移动数据不如移动计算”的理念Spark在进行任务调度的时候会尽可能地将计算任务分配到它所要处理的数据块的存储位置。 3. RDD的处理过程 Spark用Scala语言实现了RDD的API程序开发者可以通过调用API对RDD进行操作。RDD经过一系列的“转换”操作每一次转换都会产生不同的RDD以供下一次“转换”操作使用直到最后一个RDD经过“行动”操作才会被真正计算处理并输出到外部数据源中若是中间的数据结果需要复用则可以进行缓存处理将数据缓存到内存中。整个处理过程如图所示。
http://www.hkea.cn/news/14505164/

相关文章:

  • 网站建设ui设计公司苏州网页制作公司哪家好
  • 云服务器搭建个人网站工业和信息化部装备工业发展中心
  • 什么网站做弹窗广告好自己做网站怎么推广
  • 杭州市拱墅区网站建设网站标题乱码
  • 在重庆_那里可以做诚信网站认证上海公共招聘官网
  • 廊坊那家做网站排行榜wordpress 流量
  • 湖北省建设厅政务公开网站wordpress淘宝主题破解
  • 北海 网站制作工怎么开网店?去哪里注册?
  • 无忧网站建设wordpress孵化器主题
  • 找个人制作网页的网站免费网络推广
  • 知乎网站内容建设的逻辑网络推广需要什么技能
  • 江西网站建设哪家好济宁做网站优化
  • 大连 网站制作 外贸网站备案怎么查询
  • 企业网站建设开发服务猫咪社区官网在线最新
  • 免费logo网站install.php空白 wordpress
  • 微信网站设计欣赏网络方案分析
  • 电子商务网站建设品牌广州通app下载
  • 承德优化网站建设为什么选择做游戏网站
  • 网站加黑链如何做话费卡回收网站
  • 哪个网站做五金冲压的展馆设计总结
  • 佛山市企业网站seo联系方式省住房和城乡建设厅官方网站
  • 宜昌网站建设网站建设制作博走
  • 杭州互联网网站公司营销组合策略
  • 网站建设开发五行属性重庆建筑工程造价信息网
  • 淘宝客网站主题模版环球影城客户电话
  • 在线解析网站学室内设计培训哪里好
  • 做系统用什么网站好珠海网站设计多少钱
  • 山东省建设招标信息网站wordpress安装不上
  • 局域网内部网站建设app下载做外贸网站的经验
  • 荆州网站建设流程php 搭建手机网站