当前位置: 首页 > news >正文

中山网站建设找阿江wordpress 显示文章标签

中山网站建设找阿江,wordpress 显示文章标签,最近新出的手机,上市公司网站分析文章目录 前言一、展示脚本二、使用准备1、安装python环境2、安装EPEL3、安装脚本执行需要的第三方模块 三、脚本使用方法1、配置脚本2、创建.py文件3、执行脚本4、测试生成json文件是否可用 前言 在我们构建离线数仓时或者迁移数据时#xff0c;通常选用sqoop和datax等工具进… 文章目录 前言一、展示脚本二、使用准备1、安装python环境2、安装EPEL3、安装脚本执行需要的第三方模块 三、脚本使用方法1、配置脚本2、创建.py文件3、执行脚本4、测试生成json文件是否可用 前言 在我们构建离线数仓时或者迁移数据时通常选用sqoop和datax等工具进行操作sqoop和datax各有优点datax优点也很明显基于内存所以速度上很快那么在进行全量同步时编写json文件是一项很繁琐的事是否可以编写脚本来把繁琐事来简单化接下来我将分享这样一个mysql全量同步到hive自动生成json文件的python脚本。 一、展示脚本 # codingutf-8 import json import getopt import os import sys import pymysql# MySQL 相关配置需根据实际情况作出修改 mysql_host XXXXXX mysql_port XXXX mysql_user XXX mysql_passwd XXXXXX# HDFS NameNode 相关配置需根据实际情况作出修改 hdfs_nn_host XXXXXX hdfs_nn_port XXXX# 生成配置文件的目标路径可根据实际情况作出修改 output_path /XXX/XXX/XXXdef get_connection():return pymysql.connect(hostmysql_host, portint(mysql_port), usermysql_user, passwordmysql_passwd)def get_mysql_meta(database, table):connection get_connection()cursor connection.cursor()sql SELECT COLUMN_NAME,DATA_TYPE from information_schema.COLUMNS WHERE TABLE_SCHEMA%s AND TABLE_NAME%s ORDER BY ORDINAL_POSITIONcursor.execute(sql, [database, table])fetchall cursor.fetchall()cursor.close()connection.close()return fetchalldef get_mysql_columns(database, table):return list(map(lambda x: x[0], get_mysql_meta(database, table)))def get_hive_columns(database, table):def type_mapping(mysql_type):mappings {bigint: bigint,int: bigint,smallint: bigint,tinyint: bigint,decimal: string,double: double,float: float,binary: string,char: string,varchar: string,datetime: string,time: string,timestamp: string,date: string,text: string}return mappings[mysql_type]meta get_mysql_meta(database, table)return list(map(lambda x: {name: x[0], type: type_mapping(x[1].lower())}, meta))def generate_json(source_database, source_table):job {job: {setting: {speed: {channel: 3},errorLimit: {record: 0,percentage: 0.02}},content: [{reader: {name: mysqlreader,parameter: {username: mysql_user,password: mysql_passwd,column: get_mysql_columns(source_database, source_table),splitPk: ,connection: [{table: [source_table],jdbcUrl: [jdbc:mysql:// mysql_host : mysql_port / source_database]}]}},writer: {name: hdfswriter,parameter: {defaultFS: hdfs:// hdfs_nn_host : hdfs_nn_port,fileType: text,path: ${targetdir},fileName: source_table,column: get_hive_columns(source_database, source_table),writeMode: append,fieldDelimiter: \t,compress: gzip}}}]}}if not os.path.exists(output_path):os.makedirs(output_path)with open(os.path.join(output_path, ..join([source_database, source_table, json])), w) as f:json.dump(job, f)def main(args):source_database source_table options, arguments getopt.getopt(args, -d:-t:, [sourcedb, sourcetbl])for opt_name, opt_value in options:if opt_name in (-d, --sourcedb):source_database opt_valueif opt_name in (-t, --sourcetbl):source_table opt_valuegenerate_json(source_database, source_table)if __name__ __main__:main(sys.argv[1:])二、使用准备 1、安装python环境 这里我安装的是python3环境 sudo yum install -y python32、安装EPEL EPELExtra Packages for Enterprise Linux是一个由 Fedora Special Interest Group 维护的软件仓库提供了大量在官方 RHEL 或 CentOS 软件仓库中没有的软件包。当你在 CentOS 或 RHEL 系统上需要安装一些不在官方软件仓库中的软件时通常会先安装epel - release sudo yum install -y epel-release3、安装脚本执行需要的第三方模块 pip3 install pymysql pip3 install cryptography这里可能由于斑纹问题cryptography安装不上去更新一下pip和setuptools pip3 install --upgrade pip pip3 install --upgrade setuptools重新安装cryptography pip3 install cryptography三、脚本使用方法 1、配置脚本 首先根据自己服务器修改脚本相关配置 2、创建.py文件 vim /xxx/xxx/xxx/gen_import_config.py3、执行脚本 python3 /脚本路径/gen_import_config.py -d 数据库名 -t 表名4、测试生成json文件是否可用 datax.py -p-Dtargetdir/表在hdfs存放路径 /生成的json文件路径执行时首先要确保targetdir目标地址在hdfs上存在如果没有需要创建后再次执行
http://www.hkea.cn/news/14583142/

相关文章:

  • 做网站的基本功能佛山网站建设外包
  • 企业网站标题优化现在流行用什么语言做网站
  • 长宁手机网站建设学校网站建设项目背景
  • 成免费crm特色vip自己的网站做怎样的优化调整
  • 兰州做网站的宣传推广策略有哪些
  • 网站建设收费标准教程网站模块名称
  • 好公司网站建设有哪些网站是织梦做的
  • 暴走漫画网站建设中模板天元建设集团有限公司张琥超
  • 河南省百城建设提质网站wordpress缩略图不清晰怎么办
  • 海报自动设计网站网站建设带后台
  • 本网站仅支持ie浏览器百度广告联盟官网下载
  • 应聘网站建设工程师西宁市网站设计企业
  • 商城网站建设市场分析论文wordpress 地址 固定
  • 青羊区建设和交通网站凡客优品官方网站
  • 网站没有做适配 怎么办WordPress 更改H标签
  • 礼品网站如何做seo优化诊断
  • 建设部标准定额网站玉树电子商务网站建设公司
  • 精品网站设计网站建设可行性研究报告
  • j网站开发建筑公司需要哪些资质证书
  • 白云区建网站公司公众号小程序商城
  • 个人网站建设心得vue响应式网站开发
  • iis打开网站变成下载濮阳做网站 汉狮网络
  • 大连 网站制作 外贸阿里云 wordpress 响应时间
  • 在民办医院做网站编辑怎么样长沙市做网站
  • 网站后台密码修改鄢陵网站建设
  • 目前什么编码做网站最好手机网站建设联系方式
  • 网站设计数据库怎么做wordpress显示作者信息
  • 怎么自己做视频网站wordpress取消默认图片
  • 成都网站开发哪家公司好图片库网站建设报价
  • 如何在百度上搜索到自己的网站双重预防机制信息化平台