当前位置: 首页 > news >正文

要加强网站内容建设wordpress标签分类

要加强网站内容建设,wordpress标签分类,网络设计课,网站开发工程师需要什么证书一、默认数据源 案例演示读取Parquet文件 查看Spark的样例数据文件users.parquet 1、在Spark Shell中演示 启动Spark Shell 查看数据帧内容 查看数据帧模式 对数据帧指定列进行查询#xff0c;查询结果依然是数据帧#xff0c;然后通过write成员的save()方法写入HDF…一、默认数据源 案例演示读取Parquet文件 查看Spark的样例数据文件users.parquet 1、在Spark Shell中演示 启动Spark Shell 查看数据帧内容 查看数据帧模式 对数据帧指定列进行查询查询结果依然是数据帧然后通过write成员的save()方法写入HDFS指定目录 查看HDFS上的输出结果 执行SQL查询 查看HDFS上的输出结果 课堂练习1、将4.1节的student.txt文件转换成student.parquet 得到学生数据帧 - studentDF 将学生数据帧保存为parquet文件 查看生成的parquet文件 复制parquet文件到/datasource/input目录 课堂练习2、读取student.parquet文件得到学生数据帧并显示数据帧内容 2、在IntelliJ IDEA里演示 在这里插入图片描述 将java目录改成scala目录 在pom.xml文件里添加相关依赖设置源程序文件夹 ?xml version1.0 encodingUTF-8? project xmlnshttp://maven.apache.org/POM/4.0.0xmlns:xsihttp://www.w3.org/2001/XMLSchema-instancexsi:schemaLocationhttp://maven.apache.org/POM/4.0.0http://maven.apache.org/xsd/maven-4.0.0.xsdmodelVersion4.0.0/modelVersiongroupIdnet.cxf.sql/groupIdartifactIdSparkSQLDemo/artifactIdversion1.0-SNAPSHOT/versiondependenciesdependencygroupIdorg.scala-lang/groupIdartifactIdscala-library/artifactIdversion2.12.15/version/dependencydependencygroupIdorg.apache.spark/groupIdartifactIdspark-core_2.12/artifactIdversion3.1.3/version/dependencydependencygroupIdorg.apache.spark/groupIdartifactIdspark-sql_2.12/artifactIdversion3.1.3/version/dependency/dependenciesbuildsourceDirectorysrc/main/scala/sourceDirectory/build /project log4j.rootLoggerERROR, stdout, logfile log4j.appender.stdoutorg.apache.log4j.ConsoleAppender log4j.appender.stdout.layoutorg.apache.log4j.PatternLayout log4j.appender.stdout.layout.ConversionPattern%d %p [%c] - %m%n log4j.appender.logfileorg.apache.log4j.FileAppender log4j.appender.logfile.Filetarget/spark.log log4j.appender.logfile.layoutorg.apache.log4j.PatternLayout log4j.appender.logfile.layout.ConversionPattern%d %p [%c] - %m%n?xml version1.0 encodingUTF-8? configurationpropertydescriptiononly config in clients/descriptionnamedfs.client.use.datanode.hostname/namevaluetrue/value/property /configuration 创建net.cxf.sql.day01包在包里创建ReadParquetFile对象 package net.cxf.sql.day01 import org.apache.spark.sql.SparkSession /*** 功能读取Parquet文件* 作者cxf* 日期2023年06月07日*/object ReadParquetFile {def main(args: Array[String]): Unit {// 创建或得到Spark会话对象val spark SparkSession.builder().appName(ReadParquetFile).master(local[*]).getOrCreate()// 加载student.parquet文件得到数据帧val studentDF spark.read.load(hdfs://master:9000/datasource/input/student.parquet)// 显示学生数据帧内容studentDF.show// 查询20岁以上的女生val girlDF studentDF.filter(gender 女 and age 20)// 显示女生数据帧内容girlDF.show// 保存查询结果到HDFS保证输出目录不存在girlDF.write.save(hdfs://master:9000/datasource/output)} } 运行程序查看控制台结果 在HDFS查看输出结果 二、手动指定数据源 一案例演示读取不同数据源 1、读取csv文件 查看Spark的样例数据文件people.csv 将people.csv文件上传到HDFS的/datasource/input目录然后查看文件内 读取人员csv文件得到人员数据帧 查看人员数据帧内容 查看人员数据帧内容 2、读取json保存为parquet 查看people.json文件 将people.json上传到HDFS的/datasource/input目录并查看其内容 查看生成的parquet文件 现在读取/datasource/input/people.parquet文件得到人员数据帧 查看人员数据帧内容 3、读取jdbc数据源保存为json文件 查看student数据库里的t_user表 报错找不到数据库驱动程序com.mysql.jdbc.Driver 将数据库驱动程序上传到master虚拟机的/opt目录 将数据库驱动程序拷贝到$SPARK_HOME/jars目录 加载jdbc数据源成功但是有个警告需要通过设置useSSLfalse来消除 执行命令userdf.show() 在虚拟机slave1查看生成的json文件 三、数据写入模式 案例演示不同写入模式 查看数据源 查询该文件name里采用覆盖模式写入/result/result目录里本来有东西的 导入SaveMode类 在slave1虚拟机上查看生成的json文件 查询age列 在slave1虚拟机上查看追加生成的json文件 四、分区自动推断 一分区自动推断概述 以people作为表名gender和country作为分区列给出存储数据的目录结构 二分区自动推断演示 1、建四个文件 在master虚拟机上/home里创建如下目录及文件其中目录people代表表名gender和country代表分区列people.json存储实际人口数据 2、读取表数据 启动Spark Shell 3、输出Schema信息 4、显示数据帧内容
http://www.hkea.cn/news/14442019/

相关文章:

  • 网站管理登录怎建网站
  • 电商网站设计教程深圳网页制作设计
  • 高端品牌网站建设兴田德润在哪儿跨境电商都有哪些平台
  • 文创做的好的网站推荐上海做网站企业
  • 车陂手机网站建设报价数字广东网络建设有限公司
  • 全国建设部网站官网淘宝联盟怎样做新增网站推广
  • 教育网站制作网站办公室隔断
  • 先看网站案例您的网站也可以这么做网站建设哪家g
  • 茌平网站开发wordpress侧栏导航栏
  • 建筑材料采购网站公司网站域名如何申请
  • 博客做网站赣州新闻发布会
  • 做网站业务好干吗wordpress口令查看内容
  • 四川广汉市规划和建设局网站汤阴做网站
  • 网站优化需要什么深圳市宝安区中心医院
  • 企业网页与网站区别centos7装wordpress
  • 目前好的外贸网站网上培训课程平台
  • 广州品牌网站阿里云企业网站模板
  • 重庆seo网站排名优化域名服务商平台
  • 为什么网站上传照片传不上去毕节市网站建设58同城
  • 建设银行+贷款+查询+网站网站怎么做下载网页代码
  • 提供网站建设工具的公司wordpress 获取首页
  • 三水专业网站建设哪家好二级建造师证件查询
  • 邹城外贸网站建设网站开发语言分辨
  • 众筹网站开发自己做网站2008R2好还是win7
  • 昆山建设信息网站ps制作网站过程
  • 免费网站怎么做做经营网站怎么赚钱
  • pop布局的网站seo顾问公司
  • 餐饮小程序开发网站建设优化哪家公司好
  • 廊坊酒店网站建设建设工程安全监督备案网站
  • 个人网站要怎么做商城网站开发价