当前位置：首页 > news >正文

营销公司网站模板小程序开发

news 2026/4/6 6:23:01

营销公司网站模板,小程序开发,佛山市禅城网站建设公司,宜兴网站策划目录 Spark入门: 概述历史概述SparkCore：RDDSparkSQL:SparkStreamingSpark内核调优 Spark概述回顾： Hadoop HDFS存储 MR分析计算 YARN调度 Hadoop的MR计算中的shuffle需要落盘，速度不够快。 Spark是一种基于内存的分析计算引擎。历史…

Hadoop MR框架: 计算过程中Map和Reduce之间的shuffle过程需要落盘，reduce结束后也需要落盘。
Spark RDD框架：会主动考虑前后数据的逻辑性，只在必要时进行shuffle落盘。适合迭代式计算，图形计算。Spark支持优化，避免了一些重复冗余的计算操作，是基于懒加载机制的框架。

Spark模块和特点

模块： SparkSQL + SparkCore +Yarn
特点：

快：基于内存运算比Hadoop MR快100倍以上，有很强的自适应优化，帮你自动计算出最合适的任务资源调度方案。
易用：支持java, Python, Scala的API
通用：提供了统一的解决方案，支持SQL、实时流处理
兼容性：调度和计算分离，支持其他调度器，比如yarn调度器

安装部署

本地模式

提交Spark任务

bin/spark-submit \ # 提交任务
--class org.apache.spark.examples.SparkPi \
--master local[2] \ # 运行模式
# Spark案例任务，求PI
./examples/jars/spark-examples_2.12-3.1.1.jar \   
10  # 任务跑10次，取平均值

–master : 表示运行模式，默认是local[], 中括号里面表示CPU核数， 表示当前机器的全部CPU。

hadoop102:4040 Spark任务运行查看界面，建议将10替换为1000，任务结束后无法进入。可以看到计算过程的有向无环图。

YARN模式

关闭虚拟机
重新解压spark，命名为spark-yarn目录
关闭物理和虚拟的内存检查
修改spark-env.sh配置文件的YARN_CONF_DIR，告诉spark，yarn配置文件在哪里。
hadoop103:8088 通过YARN查看任务执行情况。
配置历史服务
- 修改spark-defaults.conf, 配置日志存储路径
- 修改spark-env.sh, 添加如下配置

export SPARK_HISTORY_OPTS="
-Dspark.history.ui.port=18080 
-Dspark.history.fs.logDirectory=hdfs://hadoop102:8020/directory 
-Dspark.history.retainedApplications=30"

创建历史服务器的目录
sbin/start-history-server.sh，启动历史服务器HistoryServer
再次提交计算PI的任务，使用Hadoop102:18080查看任务DAG图解，查看有多少个阶段和计算过程。主要查看executor界面，查看任务申请了多少个执行器，和执行器的运行时间。
10.配置历史日志，为了能够通过YARN网页跳转到Spark历史日志网页中。在spark-defaults.conf添加如下信息：

spark.yarn.historyServer.address=hadoop102:18080
spark.history.ui.port=18080

运行流程

Spark yarn 也有两种模式：

客户端模式：初始化，任务的切分都在本地执行。适合内网执行，大数据一般都是内网运行，故一般是客户端模式，任务结果就在当前客户端可以看到。
集群模式：初始化，任务的切分在集群的AM中执行，适合外网执行，任务结果需要到YARN中才能查看到。

查看全文

http://www.hkea.cn/news/814126/

南安市网站建设成都今天重大新闻事件

网站后台补丁如何做软文有哪几种类型

网站建设的费用包括哪些内容资讯门户类网站有哪些

一站式服务图片制作网页的基本步骤

个人网站建设网站网络网站推广

asp做的药店网站模板北京百度快照推广公司

网站建设泉州效率网络seo的优化策略有哪些

页网站无锡网站制作推广

一流的龙岗网站建设目前最靠谱的推广平台

企业营销型网站费用短视频推广引流

化妆品可做的团购网站有哪些seo研究中心南宁线下

漂亮大气的装潢室内设计网站模板单页式html5网页模板包前端优化

论坛网站开发开题报告青岛百度推广多少钱

文山做网站如何优化百度seo排名

上海展陈设计公司有哪些成都网站seo性价比高

做新闻网站需要什么手续河北软文搜索引擎推广公司

广州网站建设联系电话seo推广的公司

营销公司网站模板小程序开发

目录

Spark概述

历史

两种模式

Hadoop和Spark的对比

Spark模块和特点

安装部署

本地模式

YARN模式

运行流程

相关文章：