当前位置: 首页 > news >正文

龙川县建设网站建设银行企业网上银行

龙川县建设网站,建设银行企业网上银行,psd网页模板免费下载,网站建设时间规划表目录 Java使用Spark入门 环境准备 安装JDK 安装Spark 编写Spark应用程序 创建SparkContext 读取文本文件 计算单词出现次数 运行Spark应用程序 总结 Java使用Spark入门 本文将介绍如何使用Java编写Spark应用程序。Spark是一个快速的、通用的集群计算系统#xff0c;它可以处理…目录 Java使用Spark入门 环境准备 安装JDK 安装Spark 编写Spark应用程序 创建SparkContext 读取文本文件 计算单词出现次数 运行Spark应用程序 总结 Java使用Spark入门 本文将介绍如何使用Java编写Spark应用程序。Spark是一个快速的、通用的集群计算系统它可以处理大规模数据。Spark提供了一个简单的编程接口可以使用Java、Scala、Python和R等语言编写应用程序。 环境准备 在开始编写Spark应用程序之前需要准备以下环境 Java开发环境JDK Spark安装包 安装JDK 如果您还没有安装Java开发环境请先下载并安装JDK。您可以从Oracle官网下载JDK安装包https://www.oracle.com/java/technologies/javase-downloads.html 安装Spark 您可以从Spark官网下载Spark安装包https://spark.apache.org/downloads.html 下载完成后解压缩安装包到您的本地文件系统中。 编写Spark应用程序 在本节中我们将编写一个简单的Spark应用程序该程序将读取一个文本文件并计算单词出现的次数。 创建SparkContext 首先我们需要创建一个SparkContext对象。SparkContext是Spark应用程序的入口点它负责与集群通信并管理应用程序的资源。 import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaSparkContext; public class WordCount {     public static void main(String[] args) {         // 创建SparkConf对象         SparkConf conf new SparkConf()                 .setAppName(WordCount)                 .setMaster(local); // 创建JavaSparkContext对象         JavaSparkContext sc new JavaSparkContext(conf); // TODO: 编写应用程序代码 // 关闭JavaSparkContext对象         sc.close();     } } 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 在上面的代码中我们创建了一个SparkConf对象并设置了应用程序的名称和运行模式。然后我们创建了一个JavaSparkContext对象并传递SparkConf对象作为参数。 读取文本文件 接下来我们需要读取一个文本文件。Spark提供了多种方式来读取数据例如从本地文件系统、HDFS、Amazon S3等。 import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; public class WordCount {     public static void main(String[] args) {         // 创建SparkConf对象         SparkConf conf new SparkConf()                 .setAppName(WordCount)                 .setMaster(local); // 创建JavaSparkContext对象         JavaSparkContext sc new JavaSparkContext(conf); // 读取文本文件         JavaRDDString lines sc.textFile(input.txt); // TODO: 编写应用程序代码 // 关闭JavaSparkContext对象         sc.close();     } } 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 在上面的代码中我们使用JavaSparkContext对象的textFile方法读取了一个名为input.txt的文本文件并将其存储在一个JavaRDD对象中。 计算单词出现次数 最后我们需要编写代码来计算单词出现的次数。我们可以使用flatMap和reduceByKey方法来实现这个功能。 import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import java.util.Arrays; import java.util.Map; public class WordCount {     public static void main(String[] args) {         // 创建SparkConf对象         SparkConf conf new SparkConf()                 .setAppName(WordCount)                 .setMaster(local); // 创建JavaSparkContext对象         JavaSparkContext sc new JavaSparkContext(conf); // 读取文本文件         JavaRDDString lines sc.textFile(input.txt); // 计算单词出现次数         JavaRDDString words lines.flatMap(line - Arrays.asList(line.split( )).iterator());         JavaRDDString filteredWords words.filter(word - !word.isEmpty());         JavaPairRDDString, Integer wordCounts filteredWords.mapToPair(word - new Tuple2(word, 1))                 .reduceByKey((x, y) - x y);         MapString, Integer wordCountsMap wordCounts.collectAsMap(); // 输出结果         for (Map.EntryString, Integer entry : wordCountsMap.entrySet()) {             System.out.println(entry.getKey() : entry.getValue());         } // 关闭JavaSparkContext对象         sc.close();     } } 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 在上面的代码中我们使用flatMap方法将每行文本拆分成单词并使用filter方法过滤掉空单词。然后我们使用mapToPair方法将每个单词映射为一个键值对其中键为单词值为1。最后我们使用reduceByKey方法将具有相同键的键值对合并并计算每个单词出现的次数。最后我们使用collectAsMap方法将结果收集到一个Map对象中并输出结果。 运行Spark应用程序 在完成Spark应用程序的编写后我们可以使用以下命令来运行它 $ spark-submit --class WordCount --master local WordCount.jar 1 其中WordCount是应用程序的类名WordCount.jar是应用程序的打包文件。 总结 本文介绍了如何使用Java编写Spark应用程序。我们首先创建了一个SparkContext对象然后使用textFile方法读取了一个文本文件并使用flatMap和reduceByKey方法计算了单词出现的次数。最后我们使用spark-submit命令运行了应用程序。 ———————————————— 版权声明本文为CSDN博主「AcerMr」的原创文章遵循CC 4.0 BY-SA版权协议转载请附上原文出处链接及本声明。 原文链接https://blog.csdn.net/qq_37480069/article/details/130959383
http://www.hkea.cn/news/14299296/

相关文章:

  • 制作网站需要哪些成本柳州做网站的
  • 环球旅行社网站建设规划书论文邯郸模板建站教程
  • python做网站显示表格国家学历提升官网
  • 专业郑州网站建设WordPress数据库自动切换
  • 网站建设自己能做吗网络直播公司营销方案
  • 装饰公司手机网站网站哪些功能是PHP做的
  • 怎么建立一个购物网站自己做竞猜网站挣钱吗
  • 网站建设 接单网站返回首页按钮
  • 成都正规集团网站制作维护wordpress设置备案
  • 免费网站空间怎么北京市装修公司前10名
  • 现在建设网站都用什么软件下载logo免费自动生成器app
  • clo3d代做网站织梦淘宝客网站
  • 可信网站认证服务中心眼科医院网站建设方案
  • 丰润网站建设品质好是什么意思
  • 个人网站域名申请个人养老金怎么缴纳
  • 旅游网站设计代码html软件推广方法
  • 游戏建设网站装修设计师培训班
  • 北京改网站邢台信息发布平台
  • 中国能源建设集团网站深圳做网站哪个平台好
  • 做微信h5的网站宝德科技专业嘉兴网站建设
  • 广西智能网站建设方案营销顾问
  • 对网站政务建设的建议网站建设优化价格
  • 沈阳网站建设团队wordpress 文章带字段
  • 榆林北京网站建设商洛网站制作
  • wordpress升级vipseo效果检测步骤
  • 营销型网站建设公司哪家好查询网站是否正规
  • 网站建设改版目的部门网站建设方案
  • 网站后台安全网页设计模板素材美食
  • 网络营销案例ppt课件seo技术团队
  • 网站收录入口南京建设工程公共资源交易中心网站