当前位置: 首页 > news >正文

六站合一的优势合肥网站建设制作价格

六站合一的优势,合肥网站建设制作价格,深圳网站设计工作室,ps网站logo制作教程背景 开发时遇到一个较为复杂的周期需求#xff0c;为了适配读取各种数据库中的数据并将数据库数据转换为DataFrame并进行后续的开发分析工作#xff0c;做了如下代码。 在爷们开发这段生产中的代码#xff0c;可适配mysql,hive,hbase#xff0c;gbase等等…背景         开发时遇到一个较为复杂的周期需求为了适配读取各种数据库中的数据并将数据库数据转换为DataFrame并进行后续的开发分析工作做了如下代码。        在爷们开发这段生产中的代码可适配mysql,hive,hbasegbase等等等等基本涉及到数据库的情况基本可以进行。可以说是非常之NB了 数据流程 由于该代码片段主要关注数据处理流程而非实际数据内容,当然我也不能把特殊数据给大家展示后面有时间再造一批test数据吧因此没有提供样例数据。不过可以根据实际使用的数据库和表结构提供相应的样例数据以供测试和验证。 具体的数据自己造就行了咱这段逻辑时经过大数据量考验的 代码v1 import org.apache.spark.storage.StorageLevel import org.apache.spark.sql.functions.{udf,col,date_format} import scala.util.matching.Regex//2024,lee研发适配,可以说这段代码的通用性非常高非常NB //time:202401GZ // https://blog.csdn.net/qq_52128187?typeblog //获取数据库中的数据并转为dataframe,可以使hbase也可以是mysql val table数据库传出的数据 val dfininputRDD(table).asInstanceOf[org.apache.spark.sql.DataFrame] dfin.createOrReplaceTempView(s$table) dfin.show(3) val sql_table sql条件 val sql inputRDD(sql_table).asInstanceOf[String] println(打印前序导出的sql: sql)//正则结合sql与df,获取最终数据 val regex new Regex((?!)from\\s[^\\s]) val actualSql regex.replaceFirstIn(sql,sfrom ${table}) println(打印最终sql:actualSql)//解析sql val resultDf spark.sql(actualSql) resultDf.show(10,false) 代码V2 在另一个环境测试时上面的代码运行时出现了一个bug如下 org.apache.spark.sql.AnalysisException: org.apache.hadoop.hive.ql.metadata.HiveException: Unable to fetch table all_beforexxxxx.Exception thrown when executing query :SELECT DISTINCT org.apache.hadoop.hive.metastore.model.MTable AS NUCLEUS_TYPE,A0.CREATE_TIME,A0.LAST_ACCESS_TIME,A0.OWNER,A0.OWNER_TYPE, A0.RETENTION,A0.TBL_NAME,A0.TBL_TYPE,A0.TBL_ID FROM TBLS A0 LEFT OUTER JOIN DBS B0 ON A0.DB_ID B0.DB_ID WHERE A0.TBL_NAME ? AND B0.NAME ?; 问题描述详细排查了一下是由于解析sql语句时出现了一个bug,但是我在另一个环境这样写是可以解析的神奇哦 问题解决我是如何解决的呢一看就是解析表的时候出现问题定位代码是正则表达式的问题。修改后的代码 import org.apache.spark.storage.StorageLevel import org.apache.spark.sql.functions.{udf,col,date_format} import scala.util.matching.Regex//2024 //2024,lee研发适配,可以说这段代码的通用性非常高非常NB //time:202401GZ // https://blog.csdn.net/qq_52128187?typeblog //获取数据库中的数据并转为dataframe,可以使hbase也可以是mysql val table数据_tegeXNph val dfininputRDD(table).asInstanceOf[org.apache.spark.sql.DataFrame] dfin.createOrReplaceTempView(s$table) dfin.show(3)//获取sql语句 val sql_table sql条件导出_周期 val sql inputRDD(sql_table).asInstanceOf[String] println(打印前序导出的sql: sql)//正则结合sql与df,获取最终数据 // val regex new Regex((?!)from\\s[^\\s])会报错 //org.apache.spark.sql.AnalysisException: org.apache.hadoop.hive.ql.metadata.HiveException: Unable to fetch table all_before_xxx. Exception thrown when executing query : SELECT DISTINCT org.apache.hadoop.hive.metastore.model.MTable AS NUCLEUS_TYPE,A0.CREATE_TIME,A0.LAST_ACCESS_TIME,A0.OWNER,A0.OWNER_TYPE,A0.RETENTION,A0.TBL_NAME,A0.TBL_TYPE,A0.TBL_ID FROM TBLS A0 LEFT OUTER JOIN DBS B0 ON A0.DB_ID B0.DB_ID WHERE A0.TBL_NAME ? AND B0.NAME ?;val regex new Regex(from\\s(\\S)) // 做了排查bug修改修改后的正则表达式 val actualSql regex.replaceFirstIn(sql,sfrom ${table}) println(打印最终sql:actualSql)//解析sql val resultDf spark.sql(actualSql) resultDf.show(10,false)
http://www.hkea.cn/news/14368746/

相关文章:

  • 学校网站建设好么做网站郑州
  • 文山专业网站建设报价重庆网络推广网站推广
  • 营销型网站商城写简历的网站
  • 如何将域名指向网站互联网保险经纪公司
  • 广东电白建设集团有限公司网站专门做网站的公司交什么
  • 什么网站可以帮人做ppt赚钱wordpress 教育培训
  • 深圳网站搭建哪里找自己的服务器做网站要备案
  • 做python一个网站wordpress增加额外链接
  • 网站开发流程 百度文库我做的网站关键词到首页了没单子
  • 临沂网站建设技术托管企业营销策划案例
  • 番禺网站建设系统建一个网站要多久
  • 网站建设程序开发软件技术专业就业方向
  • 万云网络网站北京市网站维护公司
  • 汕头服饰网站建设室内设计找工作网站
  • 网站技术可行性汕尾住房和建设局网站首页
  • 沈阳网站关键词排名网站开发流程知乎
  • 使用vue做单页面网站检测网站名 注册
  • 做网站会员登陆做防水施工 上什么网站找
  • 公司网站上传图库做公司网站需要什么材料
  • 需要做网站设计代做备案网站
  • 微信手机网站案例北京网站建设服务器维护
  • 易语言做网站后端简述企业网站的建设流程
  • 灯网一家专门做灯的网站盘锦网站建设公司
  • 做网站编辑工作好不好wordpress主题演示插件
  • 网站前端工资网站换模板要怎么做
  • 网站推广策略的控制和效果评价wordpress press
  • 找销售的网站网站升级改版的目的
  • 造纸公司网站建设邀请码网站怎么做
  • 重庆怎样网站推广网站制作过程内容
  • 做系统简单还是网站简单系统如何安装wordpress