当前位置: 首页 > news >正文

做网站需要学jq吗网站备案完电信

做网站需要学jq吗,网站备案完电信,网站如何做响应式布局,小程序登录不上一、Hive的存储 一、Hive 四种存储格式 在 Hive 中#xff0c;支持四种主要的数据存储格式#xff0c;每种格式有其特点和适用场景#xff0c;不过一般只会使用Text 和 ORC #xff1a; 1. Text 说明#xff1a;Hive 的默认存储格式。存储方式#xff1a;行存储。优点…一、Hive的存储 一、Hive 四种存储格式 在 Hive 中支持四种主要的数据存储格式每种格式有其特点和适用场景不过一般只会使用Text 和 ORC 1. Text 说明Hive 的默认存储格式。存储方式行存储。优点简单易用可以通过 LOAD DATA 直接加载数据。缺点占用空间较大读取和解析速度较慢。 2. Sequence 说明以序列格式存储数据。存储方式行存储使用键值对key-value方式存储数据。优点在某些情况下支持高效的压缩。缺点占用空间比 Text 格式要大。 3. RC (Record Columnar) 说明由 Facebook 创建的一种列存储格式。存储方式列存储采用懒加载存储和管理数据。优点对每一行的数据进行单独压缩查询时只读取需要的数据提高查询速度。缺点相较于 Text 格式导入数据不够方便。 4. ORC (Optimized Row Columnar) 说明在公司工作中使用最广泛的存储格式是 RC 的优化版本。存储方式列存储具备懒加载特点。优点优化了文件的压缩和存储查询性能非常高。缺点同样不支持直接使用 LOAD DATA 导入。 注意事项 对于 Sequence、RC 和 ORC 格式不能直接使用 LOAD DATA 命令导入数据。需要先将数据导入到一个 Text 格式的表中再使用 INSERT OVERWRITE TABLE 的方式将数据复制到目标表中。 二、Hive 行列存储 1. 行存储的特点TEXT 查询性能 当查询需要满足条件的一整行数据时行存储具有优势。只需找到一个值其余的值都存储在相邻的位置可以快速访问。 2. 列存储的特点ORC 数据读取效率 在查询仅需要少数几个字段时列存储能显著减少读取的数据量因为每个字段的数据聚集存储。 数据类型一致性 每个字段的数据类型相同这使得列式存储能够针对性地设计更高效的压缩算法优化存储空间。 三、Hive 压缩格式 1. TEXTFILE 压缩算法可使用 Gzip、Bzip2 等压缩算法。适用场景适合需要频繁导入和导出的小数据量表格压缩时一般使用 Gzip 在上传HDFS前压缩。 2. ORC 默认压缩ORC 格式通常使用 Zlib 压缩。如果使用其他压缩格式可能会导致 ORC 文件实际存储空间增大。适用场景适合处理非常大的数据集。ORC 格式的读取速度通常较快默认使用 Zlib 进行压缩效果优于 Snappy一般建表时进行压缩。 压缩示例 以下是一个使用 ORC 格式创建 Hive 表的示例 CREATE TABLE IF NOT EXISTS emp_orc_ys (empno INT,ename STRING,job STRING,mgr INT,hiredate STRING,sal FLOAT,comm FLOAT,deptno INT ) ROW FORMAT DELIMITED FIELDS TERMINATED BY \t -- 使用制表符作为字段分隔符 STORED AS ORC TBLPROPERTIES (orc.compress SNAPPY); -- 改变默认压缩方式使用 Snappy 压缩四、Hive 建表手册 创建表的基本语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name (col1 type1,col2 type2,col3 type3,...colN typeN ) [PARTITIONED BY (part_col1 part_type1, part_col2 part_type2, ...)] [CLUSTERED BY (col_name1, col_name2, ...)] [ROW FORMAT DELIMITED row_format] [ROW FORMAT SERDE serde_name] [FIELDS TERMINATED BY delimiter] -- 指定字段分隔符 [COLLECTION ITEMS TERMINATED BY delimiter] -- 用于数组、映射等 [MAP KEYS TERMINATED BY delimiter] -- 用于映射 [STORED AS file_format] [LOCATION hdfs_path] [TBLPROPERTIES (compress)];参数说明 EXTERNAL可选表示创建外部表。数据存储在外部位置删除表时不会删除数据。 IF NOT EXISTS可选若表已经存在则不执行创建。 db_name.可选指定数据库名称。 table_name表的名称。 col1, col2, … colN列的名称和数据类型。 PARTITIONED BY用于指定分区列及其数据类型。 CLUSTERED BY指定分桶列通常和分桶数量一起使用。 ROW FORMAT DELIMITED指定行格式通常用于定义分隔符等。 FIELDS TERMINATED BY指定字段分隔符例如 FIELDS TERMINATED BY , 表示使用逗号作为分隔符。 COLLECTION ITEMS TERMINATED BY如果表中包含数组或映射指定集合项的分隔符。 MAP KEYS TERMINATED BY指定映射键的分隔符。 ROW FORMAT SERDE可以使用自定义的序列化和反序列化方法。 STORED AS指定存储文件的格式加 TEXTFILE、ORC、SEQUENCEFILE等。 LOCATION指定表在 HDFS 上的存储路径。 TBLPROPERTIES 指定表在 HDFS 上的压缩方式。 示例 以下是多元复杂建表示例创建一个包含数组和映射的 Hive 表 CREATE EXTERNAL TABLE IF NOT EXISTS my_database.my_table (id INT,name STRING,age INT,scores ARRAYINT, -- 数组类型attributes MAPSTRING, STRING -- 映射类型 ) PARTITIONED BY (country STRING) CLUSTERED BY (id) INTO 10 BUCKETS ROW FORMAT DELIMITED FIELDS TERMINATED BY , COLLECTION ITEMS TERMINATED BY | MAP KEYS TERMINATED BY : STORED AS ORC LOCATION hdfs://hdfs_path/my_table/ TBLPROPERTIES (orc.compress SNAPPY);
http://www.hkea.cn/news/14441041/

相关文章:

  • 程序员做网站外快网站建设的环境
  • 下载 网站样板网络推广主要做什么
  • 网站搭建php打不开成都小程序开发外包公司
  • 简述网站制作的一般流程莲都区建设局网站
  • 外国网站加速器公司logo设计案例
  • 网站建设费摊销域名解析到wordpress
  • 设计坞太原网站优化步骤
  • wordpress音乐插件百度重庆seo标准
  • 怎样推销网站建设WordPress443端口免备案
  • 需要企业网站开发门牌设计图片
  • 南通网站建设排名公司哪家好零基础学室内设计
  • 网站建设贰金手指下拉贰拾wordpress企业营销主题
  • 江苏建设监理协会官方网站wordpress网站托管
  • 免费的建站平台企业网站开发北京
  • 未来网站发展方向app生成链接
  • 网站飘窗怎么做孝感网站建设孝感
  • 网站托管要求html5 服装网站
  • 网站开发维护前景怎么做好网站建设
  • 网站字体大小选择注册1千万的公司需要多少钱
  • 互联网 现代农业网站建设支付宝怎么做网站维护
  • 科技公司网站系统诸城网站建设多少钱
  • wordpress 门户网站源码中英文网站源码php
  • 宁波市住房和城乡建设厅网站设计案例分享网站
  • 滨海做网站的公司新东方英语线下培训学校
  • 百度联盟 网站备案保健品手机网站模板
  • 网站做最优是什么意思app服务器搭建教程
  • 如何做psd的模板下载网站跨境电商 网站开发
  • 品牌网站设计公司哪家什么是搜索引擎优化推广
  • 建设银行手机不用了怎么登陆网站襄阳优化公司
  • 济南长兴建设集团有限公司网站衡水网站制作与推广