当前位置: 首页 > news >正文

烟台优化网站深圳牌申请网站空间

烟台优化网站,深圳牌申请网站空间,注册一个商标多少钱,河南制作网站电话面试题来源#xff1a; 《大数据面试题 V4.0》 大数据面试题V3.0#xff0c;523道题#xff0c;679页#xff0c;46w字 可回答#xff1a;Spark常见的算子介绍一下 参考答案#xff1a; 我们先来看下Spark算子的作用#xff1a; 下图描述了Spark在运行转换中通过算…面试题来源 《大数据面试题 V4.0》 大数据面试题V3.0523道题679页46w字 可回答Spark常见的算子介绍一下 参考答案 我们先来看下Spark算子的作用 下图描述了Spark在运行转换中通过算子对RDD进行转换。 算子是RDD中定义的函数可以对RDD中的数据进行转换和操作。 输入在Spark程序运行中数据从外部数据空间如分布式存储textFile读取HDFS等parallelize方法输入Scala集合或数据输入Spark数据进入Spark运行时数据空间转化为Spark中的数据块通过BlockManager进行管理。 运行在Spark数据输入形成RDD后便可以通过变换算子如filter等对数据进行操作并将RDD转化为新的RDD通过Action算子触发Spark提交作业。 如果数据需要复用可以通过Cache算子将数据缓存到内存。 输出程序运行结束数据会输出Spark运行时空间存储到分布式存储中如saveAsTextFile输出到HDFS或Scala数据或集合中collect输出到Scala集合count返回Scala int型数据。 1、Transform和Action Transformation是得到一个新的RDD但并不立即执行计算只是记录下这个操作。方式很多比如从数据源生成一个新的RDD从RDD生成一个新的RDD。 Action是指触发对RDD进行计算的操作得到一个值或者一个结果直接将RDD cache到内存中。 因为所有的Transformation都是采用的懒策略就是如果只是将Transformation提交是不会执行计算的计算只有在Action被提交的时候才被触发。这样有利于减少内存消耗提高了执行效率。 2、算子原理 1Transformation map(func)返回一个新的分布式数据集由每个原元素经过func函数转换后组成。 filter(func)返回一个新的数据集由经过func函数后返回值为true的原元素组成。 flatMap(func)类似于map但是每一个输入元素会被映射为0到多个输出元素因此func函数的返回值是一个Seq而不是单一元素。 union(otherDataset)返回一个新的数据集由原数据集和参数联合而成。 groupByKey([numTasks])在一个由K,V对组成的数据集上调用返回一个KSeq[V])对的数据集。注意默认情况下使用8个并行任务进行分组你可以传入numTask可选参数根据数据量设置不同数目的Task。 reduceByKey(func, [numTasks])在一个KV)对的数据集上使用返回一个KV对的数据集key相同的值都被使用指定的reduce函数聚合到一起。和groupbykey类似任务的个数是可以通过第二个可选参数来配置的。 join(otherDataset, [numTasks])在类型为K,V)和K,W)类型的数据集上调用返回一个K,(V,W))对每个key中的所有元素都在一起的数据集。 2Action reduce(func)通过函数func聚集数据集中的所有元素。Func函数接受2个参数返回一个值。这个函数必须是关联性的确保可以被正确的并发执行。 collect()在Driver的程序中以数组的形式返回数据集的所有元素。这通常会在使用filter或者其它操作后返回一个足够小的数据子集再使用直接将整个RDD集Collect返回很可能会让Driver程序OOM。 count()返回数据集的元素个数。 foreach(func): 在数据集的每一个元素上运行函数func。这通常用于更新一个累加器变量或者和外部存储系统做交互。
http://www.hkea.cn/news/14281523/

相关文章:

  • wordpress 卖票的插件济南网络优化推广
  • 湖南智能网站建设平台网页软件开发
  • 建设企业网站包含什么静态网站论文目录
  • 地方网站域名选择中国著名的个人网站
  • 北京移动端网站设计适合女人的小型加工厂
  • 东营网站建设那家好wap网站在线生成
  • 中国网站制作企业排行榜企业网站内容如何备案
  • 商城网站建设课设网页编辑工具是什么
  • 网页网站设计制作wordpress 分类 文章数
  • 广州网站设计流程管理咨询公司是做什么
  • 服装网站建设平台分析阿里云做电影网站吗
  • 上海的招聘网站有哪些网站怎么做才
  • 网站建设選平台网站制作方法
  • 网站会员管理哪里可以免费注册网站
  • 红色主题网站模板cdq百度指数
  • 网站怎么做边框医疗网站
  • 找人建设一个网站多少钱公关公司组织架构图
  • 做网站第一步域名查询备案
  • 做调查的有哪些网站有哪些网站设计 做鼠标效果
  • 拖鞋设计网站推荐站酷网免费素材图库官网
  • 网站跨机房建设方案抖音营销推广
  • seo网站课程做淘宝店招的网站
  • 网站手机版后台专业网站建设品牌策划
  • 怎么促成客户做网站做网站去哪找客户
  • 思茅网站建设无线播放电视的浏览器
  • 个人网站模块桂林建网站的公司
  • 贵州网站制作设计公司哪家好铜铜铜铜铜铜铜铜好大好深色
  • 网站开发团队如何接活seo程序
  • wordpress 百度 tagseo网站排名优化教程
  • 网站建设发布实训总结wordpress仪表盘模块