当前位置: 首页 > news >正文

石河子做网站的公司做微信网站的公司

石河子做网站的公司,做微信网站的公司,wordpress响应式商场,重庆装修论坛文章目录 准备连接hive的配置申请kerberos tgt在scala项目启动本地spark本地Jupyter Notebook启动pyspark 解决在wsl下进行开发、调试时#xff0c;需要连接kerberos鉴权的hdfs、hive的问题 准备连接hive的配置 core-site.xml、hdfs-site.xml、yarn-site.xml、hive-site.xml复… 文章目录 准备连接hive的配置申请kerberos tgt在scala项目启动本地spark本地Jupyter Notebook启动pyspark 解决在wsl下进行开发、调试时需要连接kerberos鉴权的hdfs、hive的问题 准备连接hive的配置 core-site.xml、hdfs-site.xml、yarn-site.xml、hive-site.xml复制到本地 不知道为什么yarn-site.xml里的配置也必须存在即使不使用yarn运行spark 申请kerberos tgt 在/etc/krb5.conf记录账户域名对应的授权服务地址注意配置default_ccache_nameTicket Granting Ticket存放路径的格式让java程序能够自动读取到tgt [libdefaults]dns_lookup_realm falseticket_lifetime 24hrenew_lifetime 7dforwardable truerdns falsepkinit_anchors FILE:/etc/pki/tls/certs/ca-bundle.crtspake_preauth_groups edwards25519default_realm COMPANY.UAT.COM# default_ccache_name KEYRING:persistent:%{uid}default_ccache_name FILE:/tmp/krb5cc_%{uid} [realms] COMPANY.UAT.COM {kdc 10.0.0.1admin_server 10.0.0.1 }申请当前操作系统用户的进程都可使用的tgt(Ticket Granting Ticket) # 24小时过期每天要执行一次 kinit -kt /etc/kerberos/hive.keytab hiveCOMPANY.UAT.COM使用klist命令可以看到已申请的tgt存储在/tmp/krb5cc_%{uid}文件里 java默认会访问/etc/krb5.conf记录的授权服务地址使用/tmp/krb5cc_%{uid}文件里的tgt信息申请访问具体服务的ticket 在scala项目启动本地spark 连接配置文件全放到项目的src/test/resources后可执行单元测试 import org.scalatest.funsuite.AnyFunSuite import org.apache.spark.sql.SparkSessionclass SparkTest extends AnyFunSuite with BeforeAndAfterAll {val catalogImpl: String hivelazy val spark: SparkSession SparkSession.builder().appName(scala test).master(local[1]).enableHiveSupport()// 如果不使用kinit命令预先申请tgt也可让spark自行申请// .config(spark.kerberos.keytab, /etc/kerberos/hive.keytab)// .config(spark.kerberos.principal, hiveCOMPANY.UAT.COM) .getOrCreate()test(select hive) {val df spark.sql(select * from default.temp_test1 limit 10)df.printSchema()df.show()}test(sleep) {// 挂起测试线程可在localhost:4040访问spark控制台确认是否加载了hdfs、spark相关配置Thread.sleep(1000000)} }本地Jupyter Notebook启动pyspark vscode的Jupyter插件自动为一个打开的.ipynb文件在本地启动一个对应的ipykernel_launcher并支持为每个.ipynb文件指定python venv 修改spark启动配置后需要点击重启ipykernel的按钮再重新运行启动spark的代码单元格。 在指定的python venv下安装pyspark pip3 install pyspark3.2.4连接配置文件全放到本地/apps/conf/SPARK目录内 from pyspark.sql import SparkSession import os # spark-submit能够读取环境变量SPARK_CONF_DIR指定的配置目录 os.environ[SPARK_CONF_DIR] /apps/conf/SPARK # pyspark调用spark-submit启动driver # 查看driver的java进程: ps -ef | grep pyspark-shell spark (SparkSession.builder.appName(pyspark test).master(local[1]).enableHiveSupport()# 下载hive相关依赖包.config(spark.sql.hive.metastore.version, 3.1.3).config(spark.sql.hive.metastore.jars, maven).config(spark.jars.repositories, https://maven.aliyun.com/repository/public).getOrCreate() )在后续notebook代码单元格里随意编辑、执行spark代码 df1 spark.sql(SHOW TABLES IN default) df1.show()
http://www.hkea.cn/news/14282173/

相关文章:

  • 网站ui58同城 网站建设
  • 广州手机网站建设哪家好合肥网络公司招聘
  • 微芒科技网站建设top网站整体设计流程
  • 做ui设计用什么网站社区平安建设基层网站
  • 西安城市建设职业学院官方网站网站怎么添加统计代码
  • 专业网站建设公黑马程序员培训费用
  • 手机网站你们新公司注册网上核名
  • 网站建设从哪入手办公室装修公司哪家好
  • 浙江门户网站建设公司泸州房产网
  • 各种网站建设报价徐州vi设计公司
  • 网站后台管理系统设计摄影设计师是干嘛
  • 怎么找网站网站图片设置
  • 南通哪里有做网站的泉州模板建站公司
  • 玉环建设规划局网站想用自己电脑做服务器做个网站
  • a做爰视频免费网站女装网站建设的困难和不足
  • 网站建设推广的10种方法电脑无法运行wordpress
  • 网站建设 选择题互联网运营在线培训
  • 好的案例展示网站聊城做网站价位
  • 响应式网站有什么好处东莞事件最新消息新闻
  • 网站建设与管理就业网站优化怎么做ppt
  • 国外扁平化网站设计欣赏常州网站建设公司报价
  • 湖南省建设工程信息网官网广州网站营销优化qq
  • 上海建设三类人员网站吉安哪家网站建设公司好
  • 网站微信建设运维培训班无锡网站开发定制开发
  • 天河网站建设哪个好网站视频是什么软件做的
  • 做网站需要申请商标哪些类目wordpress添加喜欢按钮
  • 在西安市建设工程交易中心网站上百度短网址生成
  • 企业公司网站源码国内有做外汇的正规网站吗
  • 可以做软件的网站有哪些功能吗网站关键词排名优化工具
  • 厦门律师网站建设沈阳快速网站建设网站开发