当前位置: 首页 > news >正文

提供免费主页空间的网站wordpress 园林模板

提供免费主页空间的网站,wordpress 园林模板,怎样做网站发布信息,wordpress缩略图圆角阴影文章目录 架构图Hadoop搭建Hive 搭建MySQL搭建官网文档下载配置配置hive环境变量配置日志文件配置hive-site 复制mysql 驱动包删除日志包初始化元数据启动metastore服务使用hive CLI启动hiveServer2访问hiveserver2客户端连接beeline shell连接 Dbeaver连接经验 基于HDFS Hive… 文章目录 架构图Hadoop搭建Hive 搭建MySQL搭建官网文档下载配置配置hive环境变量配置日志文件配置hive-site 复制mysql 驱动包删除日志包初始化元数据启动metastore服务使用hive CLI启动hiveServer2访问hiveserver2客户端连接beeline shell连接 Dbeaver连接经验 基于HDFS Hivemysql搭建离线数仓最终效果能够通过可视化界面访问数仓数据 架构图 其中 1 hive 服务包括 metastore元数据 服务和 hiveserver2服务 2 启动metastore元数据服务metastore元数据存储在MySQL中 3 在metastore服务基础上再启动hiveserver2服务即可通过代码、客户端、beeline shell去链接hive 4 建的库表存储到hdfs中 Hadoop搭建 由于资源不足搭建伪分布式利用Hadoop的HDFS分布式存储功能可以查看搭建教程 由于资源限制 hadoop环境搭建使用的是 hadoop 用户。 参见Hadoop3.2.1安装-单机模式和伪分布式模式 Hive 搭建 Hive是一个分布式的、支持容错的数仓系统用于大量数据分析。HMS提供了一个元数据仓库可以很容易进行数据分析和数据驱动决策。是很多数据湖架构使用的重要的组件。Hive是基于Hadoop可以利用HDFS存储。支持用户通过SQL语言管理数据。 MySQL搭建 搭建数仓需要先搭建MySQL这里不再赘述。 官网文档 https://hive.apache.org/development/gettingstarted/ 下载 https://archive.apache.org/dist/hive/ 这里选择的是Hive4.0版本 下载bin.tar.gz包解压 配置 配置hive环境变量 vi /etc/profile增加如下代码 # Hive export HIVE_HOME/home/datahouse/hive-4.0.0 export PATH$PATH:$HIVE_HOME/bin保存后执行刷新命令 source /etc/profile配置日志文件 # 进入配置文件目录 cd /home/datahouse/hive-4.0.0/conf将hive-log4j2.properties.template 配置文件复制成 hive-log4j2.properties 并修改配置文件 #配置日志路径 property.hive.log.dir /home/datahouse/hive-4.0.0/logs property.hive.log.file hive.log配置hive-site 进入到解压目录安装目录 # 进入到配置文件目录 cd /home/datahouse/hive-4.0.0/conf 新建 hive-site.xml文件增加如下配置内容 configuration!-- 指定存储元数据存储的数据库 --propertynamejavax.jdo.option.ConnectionURL/namevaluejdbc:mysql://localhost:3306/hive?createDatabaseIfNotExisttrueamp;useUnicodetrueamp;characterEncodingUTF-8amp;useSSLfalse/value/propertypropertynamejavax.jdo.option.ConnectionDriverName/namevaluecom.mysql.jdbc.Driver/value/propertypropertynamejavax.jdo.option.ConnectionUserName/namevalueroot/value/propertypropertynamejavax.jdo.option.ConnectionPassword/namevaluexxxx/value/property!-- 指定存储元数据要连接的地址 --propertynamehive.metastore.uris/namevaluethrift://127.0.0.1:9083/valuedescriptionURI for client to connect to metastore server/description/property!-- 指定hiveserver2连接的host --propertynamehive.server2.thrift.bind.host/namevalueyd-ss/value/property!-- 指定hiveserver2连接的端口号 --propertynamehive.server2.thrift.port/namevalue10000/value/property!-- hiveserver2的高可用参数如果不开会导致了开启tez session导致hiveserver2无法启动 --propertynamehive.server2.active.passive.ha.enable/namevaluefalse/value/property!--解决Error initializing notification event poll问题--propertynamehive.metastore.event.db.notification.api.auth/namevaluefalse/value/propertypropertynametez.mrreader.config.update.properties/namevaluehive.io.file.readcolumn.names,hive.io.file.readcolumn.ids/value/property!--配置默认计算引擎为mr--propertynamehive.execution.engine/namevaluemr/value/property!--配置HDFS数据目录--propertynamehive.metastore.warehouse.dir/namevalue/home/datahouse/hive/warehouse/value/property /configuration其中hive.metastore.warehouse.dir 目录得是hdfs分布式文件系统下的目录这个很重要若是在Linux本地文件系统下创建该目录后面是会报错的。下面是创建步骤 # 切换到hadoop账户(因为hadoop是用hadoop用户部署的所以要切换如果是root用户部署可以不用切换) [rootyd-ss ~]# su hadoop # 创建文件 [hadoopyd-ss root]$ hdfs dfs -mkdir -p /home/datahouse/hive/warehouse # 赋权 [hadoopyd-ss root]$ hdfs dfs -chmod 777 /home/datahouse/hive/warehouse/复制mysql 驱动包 找到java 连接MySQL的驱动包上传到${HIVE_HOME}/lib 目录 可以在maven中央仓库去找, https://mvnrepository.com/ 删除日志包 删除安装路径下的/lib/log4j-slf4j-impl-2.18.0.jar 防止日志出现以下信息 SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/data/soft/apache-hive-4.0.0-beta-1-bin/lib/log4j-slf4j-impl-2.18.0.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in [jar:file:/data/soft/hadoop-3.3.5/share/hadoop/common/lib/slf4j-reload4j-1.7.36.jar!/org/slf4j/impl/StaticLoggerBinder.class]初始化元数据 # 进入到${HIVE_HOME}/bin目录执行 schematool -initSchema -dbType mysql初始化元数据在数据库的表信息和数据 启动metastore服务 # bin目录下执行 hive --service metastore # 查看日志 tail -300f logs/hive.log启动会报错 需要在/etc/hosts 文件配置 127.0.0.1 yd-ss 的解析 因为/etc/hostname 文件配置了主机名 为 yd-ss 再次启动需要使用后台方式启动 # 将日志输出到metastore.log nohup bin/hive --service metastore logs/metastore.log 21 使用hive CLI 重大变化Hive4.0.0中HiveCLI已经被弃用了代替它的是Beeline。所以启动Hive4.0.0时会默认进入Beeline命令行界面而不是HiveCLI 启动hiveServer2 nohup bin/hive --service hiveserver2 logs/hiveserver2.log 21 报错 Caused by: org.apache.hadoop.security.AccessControlException: Permission denied: userroot, accessEXECUTE, inode/tmp/hive/_resultscache_:hadoop:supergroup:drwx------原因是/tmp/hive/_resultscache_目录权限问题/tmp/hive/_resultscache_ 文件夹 所属用户hadoop权限为所有者777但组和其他用户权限都为0即只有hadoop用户有rwx权限其他用户无权限。 解决方案登录hadoop用户给该文件赋权 # 切换到hadoop 用户 [rootyd-ss bin]# su hadoop #切换到 hadoop 安装目录bin下执行赋权命令 [hadoopyd-ss bin]$ hdfs dfs -chmod 777 /tmp/hive/_resultscache_再次启动即可顺利启动。当时在这个错误纠结了2天时间关键的是在赋权这个操作上。 访问hiveserver2 通过查看启动日志webui服务默认是在10002端口启动的输入以下地址即可访问 http://localhost:10002/若报错则需要在hadoop中core-site.xml配置如下参数 !-- 整合hive 用户代理设置 --propertynamehadoop.proxyuser.root.hosts/namevalue*/value/propertypropertynamehadoop.proxyuser.root.groups/namevalue*/value/property客户端连接 beeline shell连接 # 到hive安装bin目录下执行yd-ss代表当前主机名 beeline -u jdbc:hive2://yd-ss:10000 --verbosetrue -n root这个很类似MySQL的shell连接方式,如下 [rootyd-ss bin]# beeline -u jdbc:hive2://yd-ss:10000 --verbosetrue -n root !connect jdbc:hive2://yd-ss:10000 root [passwd stripped] Connecting to jdbc:hive2://yd-ss:10000 Connected to: Apache Hive (version 4.0.0) Driver: Hive JDBC (version 4.0.0) Transaction isolation: TRANSACTION_REPEATABLE_READ Beeline version 4.0.0 by Apache Hive 0: jdbc:hive2://yd-ss:10000执行下面脚本 CREATE DATABASE test; show databases;0: jdbc:hive2://yd-ss:10000 CREATE DATABASE test; going to print operations logs printed operations logs Getting log thread is interrupted, since query is done! INFO : Compiling command(queryIdroot_20241113173452_2e942d82-8b36-4dcd-9212-d3bdbd72dc92): CREATE DATABASE test INFO : Semantic Analysis Completed (retrial false) INFO : Created Hive schema: Schema(fieldSchemas:null, properties:null) INFO : Completed compiling command(queryIdroot_20241113173452_2e942d82-8b36-4dcd-9212-d3bdbd72dc92); Time taken: 0.003 seconds INFO : Concurrency mode is disabled, not creating a lock manager INFO : Executing command(queryIdroot_20241113173452_2e942d82-8b36-4dcd-9212-d3bdbd72dc92): CREATE DATABASE test INFO : Starting task [Stage-0:DDL] in serial mode INFO : Completed executing command(queryIdroot_20241113173452_2e942d82-8b36-4dcd-9212-d3bdbd72dc92); Time taken: 0.147 seconds No rows affected (0.173 seconds) 0: jdbc:hive2://yd-ss:10000 show databases; going to print operations logs printed operations logs Getting log thread is interrupted, since query is done! INFO : Compiling command(queryIdroot_20241113173512_cfc13da2-518b-406c-946d-83888acf6d37): show databases INFO : Semantic Analysis Completed (retrial false) INFO : Created Hive schema: Schema(fieldSchemas:[FieldSchema(name:database_name, type:string, comment:from deserializer)], properties:null) INFO : Completed compiling command(queryIdroot_20241113173512_cfc13da2-518b-406c-946d-83888acf6d37); Time taken: 0.02 seconds INFO : Concurrency mode is disabled, not creating a lock manager INFO : Executing command(queryIdroot_20241113173512_cfc13da2-518b-406c-946d-83888acf6d37): show databases INFO : Starting task [Stage-0:DDL] in serial mode INFO : Completed executing command(queryIdroot_20241113173512_cfc13da2-518b-406c-946d-83888acf6d37); Time taken: 0.071 seconds ---------------- | database_name | ---------------- | default | | test | ---------------- 2 rows selected (0.218 seconds) 成功执行。基本和MySQL是类似的。 如下可以看到建的库是存储到hdfs分布式文件系统中的。 [hadoopyd-ss bin]$ hdfs dfs -ls /home/datahouse/hive/warehouse/ drwxr-xr-x - root supergroup 0 2024-11-14 10:38 /home/datahouse/hive/warehouse/test.dbDbeaver连接 参考文章《DBeaver连接hive》 连接上后基本就和mysql操作类似了。 经验 1 hive 包括 metastore元数据服务和hiveserver2服务 2 hadoop服务是使用hadoop 用户部署的伪分布式模式,hive是使用root用户部署的 3 apache下的组件是真的难用文档不清晰各种xml配置问题 4 要了解hdfs分布式文件系统和Linux本地文件系统区别否则很容易遇到文件权限问题
http://www.hkea.cn/news/14321922/

相关文章:

  • 选择做网站销售的优势广州工作室做网站
  • 网站风格主要包括哪些怎么推广我的网站
  • 医院门户网站建设网站后台制作教程
  • 网易做相册旅游网站个人博客网页设计代码
  • 成都网站建设推广详情软件开发制作公司
  • 局网站建设工作中石化建设工程电子招投标交易网
  • 做网站 转行自建网站怎么关闭
  • 怎么样做自己的网站用了wordpress的电商网站
  • 智慧团登录官方网站合肥标志设计公司
  • 四川建设监理协会网站淘宝运营培训课程有用吗
  • Asp做网站前期准备做电商网站的设计思路有什么意思
  • 微信分享网站显示图片网站突然在百度消失了
  • 天猫折扣店网站建设网站制作平台能赚钱吗
  • 怀化找什么人做网站网站加alt属性对优化有影响吗
  • 云南网站建设企业e展网网站的建设情况
  • 怎么做网址导航网站诚信的小程序开发兼职网站
  • 大连博硕网站建设wordpress最大上传2g
  • 韶关网站seo千峰培训多少钱
  • 做网站的网址是哪里来的免费的个人简历模板pdf
  • 在线免费看电视剧的网站html5 做手机网站
  • 江门模板建站哪家好小说网站做编辑器
  • 有专门做序列图的网站有做义工的相亲网站吗
  • 网站会员功能网站后台编辑怎么做
  • 绍兴网站建设设计制作运维网站建设
  • 如何给公司建立网站wordpress 中文 seo 插件
  • 酷炫网站设计wordpress集群
  • 做代练的网站温州做网站多少钱
  • 网站开发技术考试题目网站 建设 原则
  • 机器配件做外贸上什么网站企业网盘软件
  • 做视频网站是什么职业郑州企业网站建设兼职