当前位置: 首页 > news >正文

精品网站建设费用 在线磐石网络吉林长春建设工程信息网站

精品网站建设费用 在线磐石网络,吉林长春建设工程信息网站,推广运营是什么工作,能看小视频的浏览器spark 相关概念补充 课程目标 了解spark的安装部署知道spark作业提交集群的过程 6.1 spark的安装部署 1、下载spark安装包 http://spark.apache.org/downloads.html 高版本不存在cdh的编译版本#xff0c;可以从官网下载源码版本#xff0c;指定高版本hadoop进行编译 编译…spark 相关概念补充 课程目标 了解spark的安装部署知道spark作业提交集群的过程 6.1 spark的安装部署 1、下载spark安装包 http://spark.apache.org/downloads.html 高版本不存在cdh的编译版本可以从官网下载源码版本指定高版本hadoop进行编译 编译步骤 1安装java(JDK 1.7及以上) export JAVA_HOME/xxx export JRE_HOME/xxx export CLASSPATH.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$CLASSPATH export PATH$JAVA_HOME/bin:$PATH2安装Maven 版本为3.3.9或者以上 下载地址https://mirrors.tuna.tsinghua.edu.cn/apache//maven/maven-3/3.3.9/binaries 配置MAVEN_HOME export MAVEN_HOME/xxx export PATH$MAVEN_HOME/bin:$PATH3下载spark源码 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0srZc7VH-1690872631229)(C:/Users/beibei/Desktop/%E6%89%80%E6%9C%89%E8%B5%84%E6%96%99/spark-core/pics/s1.png)] 4增加cdh的repository 解压spark的源码包编辑pom.xml文件 在repositories节点 加入如下配置 repositoryidcloudera/idurlhttps://repository.cloudera.com/artifactory/cloudera-repos//url/repository5编译 设置内存 export MAVEN_OPTS“-Xmx2g -XX:ReservedCodeCacheSize512m” 开始编译 ./dev/make-distribution.sh --name 2.6.0-cdh5.7.0 --tgz -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version2.6.0-cdh5.7.0 -DskipTests clean package源码编译后bin目录下的文件可能不存在可执行权限需要通过chmod指令添加可执行权限 chmod x xxx 2、规划spark安装目录 3、解压安装包 4、重命名安装目录 5、修改配置文件 spark-env.sh(需要将spark-env.sh.template重命名) 配置java环境变量 export JAVA_HOMEjava_home_path 配置PYTHON环境 export PYSPARK_PYTHON/xx/pythonx_home/bin/pythonx 配置master的地址 export SPARK_MASTER_HOSTnode-teach 配置master的端口 export SPARK_MASTER_PORT7077 6、配置spark环境变量 export SPARK_HOME/xxx/spark2.xexport PATH$PATH:$SPARK_HOME/bin 6.2 spark 集群相关概念 spark集群架构(Standalone模式) [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-u4nro2Hr-1690872631231)(/img/spark1.png)] Application 用户自己写的Spark应用程序批处理作业的集合。Application的main方法为应用程序的入口用户通过Spark的API定义了RDD和对RDD的操作。 Master和Worker 整个集群分为 Master 节点和 Worker 节点相当于 Hadoop 的 Master 和 Slave 节点。 MasterStandalone模式中主控节点负责接收Client提交的作业管理Worker并命令Worker启动Driver和Executor。WorkerStandalone模式中slave节点上的守护进程负责管理本节点的资源定期向Master汇报心跳接收Master的命令启动Driver和Executor。 Client客户端进程负责提交作业到Master。 Driver 一个Spark作业运行时包括一个Driver进程也是作业的主进程负责作业的解析、生成Stage并调度Task到Executor上。包括DAGSchedulerTaskScheduler。 Executor即真正执行作业的地方一个集群一般包含多个Executor每个Executor接收Driver的命令Launch Task一个Executor可以执行一到多个Task。 Spark作业相关概念 Stage一个Spark作业一般包含一到多个Stage。 Task一个Stage包含一到多个Task通过多个Task实现并行运行的功能。 DAGScheduler 实现将Spark作业分解成一到多个Stage每个Stage根据RDD的Partition个数决定Task的个数然后生成相应的Task set放到TaskScheduler中。 TaskScheduler实现Task分配到Executor上执行。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-byrLH5ms-1690872631232)(/img/spark2.png)] [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5jpaPOks-1690872631232)(/img/spark3.png)]
http://www.hkea.cn/news/14541321/

相关文章:

  • 马关住房和城乡建设局网站cms网站管理
  • 做网站为什么一定要去国外成都专业网站设计制作
  • 怎么用自己的电脑搭建网站网站目录 整理
  • 合肥百度团购网站建设江苏建设工程交易信息网站
  • 主营 网站建设 app开发企业网站建设的一般要素有
  • php网站商城源码查看wordpress版本对应的php
  • 做特卖的购物网站推广平台哪儿有怎么做
  • 怎么做动态的实时更新的网站金坛住房和城乡建设局网站
  • 手机网站开发相关问题如何做公司简介介绍
  • 一般网站用什么数据库网易企业邮箱费用
  • 温州集团网站建设公司二级备案域名
  • 易语言做网站登陆制作企业网站新闻列表页面网页设计
  • 怎么用htlm5自己做网站wordpress 建站服务
  • 做公司网站利润农家乐网站开发
  • 怎么做网站网站的代理yahoo提交网站入口
  • 洛阳建站洛阳市网站建设济宁高端网站建设
  • asp.net 网站启动慢南海网站建设价格
  • 网站上的图片带店面是怎么做的注册公司上什么网站
  • 如何自己制作简单脚本站长工具seo综合查询问题
  • 网站地址地图怎么做wordpress 翻译插件
  • 苏宁易购网站建设水平网络营销推广策划的步骤是什么
  • 济南正规企业站seo杭州哪家做网站比较好
  • 电商详情做的最好看的网站dede 后门暴网站
  • 电商网站维护百度无广告搜索引擎
  • 网站建设制作公司地址微信做一个小程序需要多少钱
  • 建设银行临江支行网站陕西seo快速排名
  • 辽阳专业建设网站男的做直播哪个网站好
  • 南昌整站优化德州建设信息网站
  • 网站设计报告模板及范文做qq空间动态皮肤网站
  • 小鱼儿外贸建站wordpress 自动