当前位置: 首页 > news >正文

办公用品网站系统建设源码嵌入式软件开发外包

办公用品网站系统建设源码,嵌入式软件开发外包,上市集团网站建设,西安 北郊网站建设背景 平台所有的Spark任务都是采用Spark on yarn cluster的模式进行任务提交的#xff0c;driver和executor随机分配在集群的各个节点#xff0c;pySpark 由于python语言的性质#xff0c;所以pySpark项目的依赖注定不能像java/scala项目那样把依赖打进jar包中轻松解决问题…背景 平台所有的Spark任务都是采用Spark on yarn cluster的模式进行任务提交的driver和executor随机分配在集群的各个节点pySpark 由于python语言的性质所以pySpark项目的依赖注定不能像java/scala项目那样把依赖打进jar包中轻松解决问题。所以本文主要目标就是解决pySpark在分布式的情况下如何优雅的解决项目中的依赖问题目前总结出如下三种办法供大家使用。 1、Nodemanager节点直接安装依赖 使用pip install 或者conda install 在每台nodemanager上安装所需依赖。 这个方法是最简单也是最优先能解决pySpark依赖的方法但是缺点也十分明显。 优点 操作简单易上手能快速解决依赖问题 缺点1、每台nodemanager都需要安装依赖并且未来新加入nodemanager的机器也需要安装依赖。如果未来新节点忘记安装就会导致失败。 2、直接在服务器上安装未经测试过得版本极有可能导致已经安装的python依赖与新依赖包冲突导致大数据任务执行失败。对环境是一种污染和侵入。 适用范围集群规模不大用的人少影响范围可控想快速解决问题 2、Python zip项⽬ pip freeze requirements.txt 将本地的pip依赖写⼊到requirements.txt⽂件中根据⾃⼰情况进⾏增删改。pip install -r requirements.txt --target ${PROJECT_NAME} 将依赖打⼊到项⽬当中main⽅法和依赖要平级python -m zipapp ${PROJECT_NAME} -m “main:main” 打包出⼀个.pyz⽂件mv ${PROJECT_NAME}.pyz ${PROJECT_NAME}.zip spark不仅支持提交单个.py文件执行还支持提交整个zip包来执行其中zip包中就包含了你所需要的简单依赖。 优点引入的依赖简洁明了并且调试起来也比较方便毕竟打包时间快方便提交任务也不需要额外的任务。 缺点不能控制python版本用的python版本都是nodemanager上的python版本。 适用范围引入的依赖不多项目极小的情况下并且不考虑依赖的复用。 3、Spark使⽤独⽴的Python虚拟环境提交任务 1、创建python的虚拟环境 搭建annaconda或找⼀台有annaconda环境的机器创建虚拟环境名字为sparkenv包含模块pandas conda create --name sparkenv --copy python3.6.7版本根据实际情况更改⽣成的⽬录在⽂件夹 /opt/anaconda2/envs/sparkenv使⽤pip安装所需依赖 /opt/anaconda2/envs/sparkenv/bin/pip install ******压缩成zip⽂件 1 cd /opt/anaconda2/envs/sparkenv 2 zip -r -q sparkenv.zip *将sparkenv.zip⽂件上传⾄hdfs一般都是放在hdfs的如 hadoop fs -put /tmp/aaa/sparkenv.zip2、任务配置Spark参数 配置[⾃定义配置] --archives hdfs:///tmp/aaa/sparkenv.zip#test-sparkenv这个配置加在spark -submit命令后就行。 配置[Spark Conf 配置] 1 spark.yarn.appMasterEnv.PYSPARK_PYTHONtest-sparkenv/bin/python3.6 2 spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHONtest-sparkenv/bin/python3.6 3 spark.executorEnv.PYSPARK_PYTHONtest-sparkenv/bin/python3.6 4 spark.executorEnv.PYSPARK_DRIVER_PYTHONtest-sparkenv/bin/python3.6上面这四个分别用–conf引入 比如 --conf spark.yarn.appMasterEnv.PYSPARK_PYTHONtest-sparkenv/bin/python3.6 优点独立的python环境想用什么版本的自己决定。基于业务的独立依赖包闭环低依赖冲突风险。可实现依赖复用多部门共用虚拟环境。 缺点包很大不论是上传包还是调试都非常麻烦。 适用环境需要使⽤不⽤于服务器的python版本并且引⼊的依赖错综复杂的场景适合中大型的pySpark项目。
http://www.hkea.cn/news/14301842/

相关文章:

  • 做网站网站盈利会怎么样可以做试卷并批改的网站
  • 阜新市项目建设网站建设部网站证书查询
  • 长春网站建设公司排名前十大邑做网站
  • 河南省台前县建设局网站wordpress failed to import
  • 珠宝企业的门户网站开发网校搭建平台
  • 辽宁省城乡建设规划院网站东莞市seo网络推广报价
  • 苏州建站公司 诚找苏州聚尚网络网站是怎么制作出来的
  • 网站建设 深度网如何获取免费域名
  • 东莞网站推广策划活动怎么创建公司
  • 专业制作网站的基本步骤在线印章生成器
  • 徐州网站开发兼职网络教育网站建设
  • 做淘宝客的网站需要备案吗长春网络优化哪个公司在做
  • 做包装盒有哪些网站安贞网站建设公司
  • 个人网站可以做信息网站吗免费图片素材库
  • 如何让网站长尾关键词有排名做游戏的软件
  • 网站关键词代码网站建设的合同条款
  • 汕头自助建站系统网页推广怎么做的
  • 少儿图书销售网站开发背景北京公司注册资金
  • 响应式网站的概念北京网站制作net2006
  • 广州建设水务局网站wordpress注册函数
  • wordpress 网站做外贸网络推广网站
  • 吉安网站建设wordpress模板不一样
  • 找工作哪个网站好智联招聘做网站引流
  • 电商平台正在建设中网站页面提示网站维护的要求包括哪些
  • 通栏式网站wordpress获取文章浏览次数
  • 青海企业网站制作能制作视频的软件
  • 网站服务器怎么查询滨海做网站
  • 网页设计入门代码兰州搜索引擎优化
  • 做任务给佣金的网站有哪些网站建设服务合同
  • 一站式网站建设用途微信公众号如何创建视频链接