当前位置: 首页 > news >正文

河源市住宅和城乡规划建设局网站做网站商机

河源市住宅和城乡规划建设局网站,做网站商机,视频网站建设 方案,济南网站建设方案托管文章目录 任务目标0. 版本信息1. 计算生成renkou.txt2. 文件上传至spark3. 上传文件时#xff0c;可能出现的常见错误4. 编写spark文件5. 上传集群6. 集群环境下提交任务 任务目标 在虚拟机上部署spark集群#xff0c;给定renkou.txt文件#xff0c;输出平均年龄 renkou.t… 文章目录 任务目标0. 版本信息1. 计算生成renkou.txt2. 文件上传至spark3. 上传文件时可能出现的常见错误4. 编写spark文件5. 上传集群6. 集群环境下提交任务 任务目标 在虚拟机上部署spark集群给定renkou.txt文件输出平均年龄 renkou.txt: 集群运作spark spark web界面显示结果 0. 版本信息 信息版本Scala2.11.8Java1.8spark2.2.0 hadoop安装 尚硅谷Hadoop spark spark集群搭建 tip: 按照上述spark博客集群搭建时node1是虚拟机的域名记得换成自己虚拟机的域名。如果没有填写真实ip地址即可 maven坐标 !-- https://mvnrepository.com/artifact/org.apache.spark/spark-core --dependencygroupIdorg.apache.spark/groupIdartifactIdspark-core_2.11/artifactIdversion2.2.0/version/dependency1. 计算生成renkou.txt 因为数据量很庞大, 1000万行因此采用Java多线程的方式生成数据 package com.xhf.java;import com.xhf.java.entity.Person;import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.util.Random; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.TimeUnit;/*** 生成renkou.txt*/ public class RenkouGen {static Random random new Random();static Object lock new Object();public static void main(String[] args) throws Exception {// 创建文件File file new File(E:\\B站视频创作\\Java计算人口平均_spark\\src\\main\\resources\\renkou.txt);// 判断file是否存在if (file.exists()) {file.delete();}else {file.createNewFile();}// 创建流管到BufferedWriter bw new BufferedWriter(new FileWriter(file, false));// 创建线程池 1000万, 100万(每个线程)ExecutorService executorService Executors.newFixedThreadPool(10);for (int i 0; i 10; i) {// 生成数据executorService.execute(() - {// 100万for (int j 0; j 1000000; j) {Person person new Person(j, random.nextInt(20) 40);// 数据写入文件try { // synchronized (lock) {// 加锁bw.write(person.toString()); // bw.newLine(); // }} catch (IOException e) {e.printStackTrace();}}});}// 关闭线程池executorService.shutdown();executorService.awaitTermination(10000L, TimeUnit.SECONDS);bw.close();} }tip 生成完的文件需要上传到hadoop文件系统中这样便于spark程序部署时获取文件信息如果不上传至hadoop中在集群环境下运行时可以通过main的args参数指定路径又或者将文件存放在resouce目录下打jar包后代码通过resource资源目录进行定位 2. 文件上传至spark 如果遇到问题请往下看 3.上传文件时可能出现的常见错误 文件访问url: ‘hdfs://hadoop102:8020/spark/renkou.txt’ 3. 上传文件时可能出现的常见错误 在上传的过程中可能会遇到各种报错我这里整理好参考资料 解决hadoop Permission denied: userdr.who, accessWRITE, inode“/“:kfk:supergroup:drwxr-xr-x问题Name node is in safe mode 4. 编写spark文件 package com.xhf.sparkimport org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext}object RenkouCal2_Cluster {def main(args: Array[String]): Unit {// 设置配置, master记得输入你要提交的主节点地址而不是local. 如果是local, 我的版本下能够运行, 但任务无法在UI界面上显示val conf: SparkConf new SparkConf().setAppName(renkou).setMaster(spark://hadoop102:7077)// 连接sparkval sparkContext new SparkContext(conf)val filePath: String hdfs://hadoop102:8020/spark/renkou.txt;// 读取文件 ListStringval lines: RDD[String] sparkContext.textFile(filePath)val begin: Long System.currentTimeMillis()val value: RDD[Long] lines.map(line {// String : 1 27line.split( )(1).toLong});// 计算 (把所有年龄累加 - 除以个数 - 平均年龄)val sum: Long value.reduce((x, y) x y)println(sum / (1.0 * lines.count()))println(System.currentTimeMillis() - begin)// 终止sparksparkContext.stop()} } 如果本地能够运行通过maven打成jar包上传运行 5. 上传集群 笔者采用xshell xftp的方式进行jar包上传上传至如下位置 6. 集群环境下提交任务 找到spark安装位置进入bin目录 执行如下指令 ./spark-submit \ --class com.xhf.spark.RenkouCal2 \ --master spark://hadoop102:7077 \ --executor-memory 1G \ --total-executor-cores 2 \ /export/servers/spark_demo/java_spark-1.0-SNAPSHOT.jar–class 指定运行jar包具体的启动类笔者运行的时RenkouCal2这个类–master 指定master节点的地址/export/servers/spark_demo/java_spark-1.0-SNAPSHOT.jar 指定jar包路径这个由自己决定 其它参数见名知意不在过多赘述 spark启动
http://www.hkea.cn/news/14465531/

相关文章:

  • 招聘网站哪个好英文域名在哪个网站查询
  • 怎样更新网站快照h5制作小程序有哪些
  • 做网站维护工资多少白云建设网站
  • 网站建设项目实训心得网站栏目关键词
  • 如何做实验室网站做公司网站有用吗
  • wordpress建站欣赏网站的技术建设方案
  • 什么是网络营销策略优化大师的功能有哪些
  • 株洲建设网站制作做网站的第一步
  • 上海市建设工程材料网站合肥科技网站建设
  • 建立旅游公司网站多钱wordpress怎么实时刷新数据
  • 建设企业网站中国建设银行开一个小公司需要多少钱
  • 免费个人网站建设公司业务外包是什么意思
  • 云南工程建设投标网上报名网站西安品牌策划公司排名
  • 网站图片怎么做超链接做外贸生意用哪个网站
  • 阿里国际网站官网入口制作网站链接
  • 好网站用户体验网站外部推广
  • 凡科建站平台wordpress怎么设置广告位
  • 服务推广网站作业网站建设方案
  • 上海工程建设招投标网站网址导航华图
  • 友情链接购买平台青岛网站seo推广
  • 贵州省网站备案建筑资料网
  • 网站维护细则如何做网络营销推广预算
  • 有哪些网站可以免费做推广手机网站底部电话
  • 最大的网站建设公司网络营销软件哪个好用
  • 百度怎么搜索到自己的网站网站建设快速便宜
  • 网站建设策划优点深圳 学习网站
  • 网站首页焦点图永久免费建站地址
  • 网站维护描述西安便民信息发布平台
  • 淄博哪有培训做网站的网站建设满意度调查问卷
  • 网站建设安全性指标蓝色企业网站配色