当前位置: 首页 > news >正文

优秀国外设计网站徐州网站简介

优秀国外设计网站,徐州网站简介,杭州建设工程交易网,360建筑网如何删除自己的信息前言 本节内容我们完成Flume数据采集的一个多路复用案例#xff0c;使用三台服务器#xff0c;一台服务器负责采集本地日志数据#xff0c;通过使用Replicating ChannelSelector选择器#xff0c;将采集到的数据分发到另外俩台服务器#xff0c;一台服务器将数据存储到hd…前言 本节内容我们完成Flume数据采集的一个多路复用案例使用三台服务器一台服务器负责采集本地日志数据通过使用Replicating ChannelSelector选择器将采集到的数据分发到另外俩台服务器一台服务器将数据存储到hdfs另外一台服务器将数据存储在本机使用Avro的方式完成flume之间采集数据的传输。整体架构如下 正文 ①在hadoop101服务器的/opt/module/apache-flume-1.9.0/job目录下创建job-file-flume-avro.conf配置文件用于监控hive日志并传输到avro sink - job-file-flume-avro.conf配置文件 # Name the components on this agent a1.sources r1 a1.sinks k1 k2 a1.channels c1 c2 # 将数据流复制给所有 channel a1.sources.r1.selector.type replicating # Describe/configure the source a1.sources.r1.type exec a1.sources.r1.command tail -F /tmp/hadoop/hive.log a1.sources.r1.shell /bin/bash -c # Describe the sink # sink 端的 avro 是一个数据发送者 a1.sinks.k1.type avro a1.sinks.k1.hostname hadoop102 a1.sinks.k1.port 4141 a1.sinks.k2.type avro a1.sinks.k2.hostname hadoop103 a1.sinks.k2.port 4142 # Describe the channel a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100 a1.channels.c2.type memory a1.channels.c2.capacity 1000 a1.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a1.sources.r1.channels c1 c2 a1.sinks.k1.channel c1 a1.sinks.k2.channel c2②在hadoop102服务器的/opt/module/apache-flume-1.9.0/job目录下创建job-avro-flume-hdfs.conf配置文件将监控数据传输到hadoop的hdfs系统 - job-avro-flume-hdfs.conf配置文件 # Name the components on this agent a2.sources r1 a2.sinks k1 a2.channels c1 # Describe/configure the source # source 端的 avro 是一个数据接收服务 a2.sources.r1.type avro a2.sources.r1.bind hadoop102 a2.sources.r1.port 4141 # Describe the sink a2.sinks.k1.type hdfs a2.sinks.k1.hdfs.path hdfs://hadoop101:8020/flume2/%Y%m%d/%H #上传文件的前缀 a2.sinks.k1.hdfs.filePrefix flume2- #是否按照时间滚动文件夹 a2.sinks.k1.hdfs.round true #多少时间单位创建一个新的文件夹 a2.sinks.k1.hdfs.roundValue 1 #重新定义时间单位 a2.sinks.k1.hdfs.roundUnit hour #是否使用本地时间戳 a2.sinks.k1.hdfs.useLocalTimeStamp true #积攒多少个 Event 才 flush 到 HDFS 一次 a2.sinks.k1.hdfs.batchSize 100 #设置文件类型可支持压缩 a2.sinks.k1.hdfs.fileType DataStream #多久生成一个新的文件 a2.sinks.k1.hdfs.rollInterval 30 #设置每个文件的滚动大小大概是 128M a2.sinks.k1.hdfs.rollSize 134217700 #文件的滚动与 Event 数量无关 a2.sinks.k1.hdfs.rollCount 0 # Describe the channel a2.channels.c1.type memory a2.channels.c1.capacity 1000 a2.channels.c1.transactionCapacity 100 # Bind the source and sink to the channel a2.sources.r1.channels c1 a2.sinks.k1.channel c1③在hadoop103服务器的/opt/module/apache-flume-1.9.0/job目录下创建job-avro-flume-dir.conf配置文件将监控数据传输到/opt/module/apache-flume-1.9.0/flume3目录下 - job-avro-flume-dir.conf配置文件 # Name the components on this agent a3.sources r1 a3.sinks k1 a3.channels c2 # Describe/configure the source a3.sources.r1.type avro a3.sources.r1.bind hadoop103 a3.sources.r1.port 4142 # Describe the sink a3.sinks.k1.type file_roll a3.sinks.k1.sink.directory /opt/module/apache-flume-1.9.0/flume3 # Describe the channel a3.channels.c2.type memory a3.channels.c2.capacity 1000 a3.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a3.sources.r1.channels c2 a3.sinks.k1.channel c2 - 创建数据存储目录/opt/module/apache-flume-1.9.0/flume3 ④启动hadoop集群 ⑤启动hadoop102上的flume任务job-avro-flume-hdfs.conf - 命令 bin/flume-ng agent -c conf/ -n a2 -f job/job-avro-flume-hdfs.conf -Dflume.root.loggerINFO,console ⑥启动hadoop103上的flume任务job-avro-flume-dir.conf - 命令 bin/flume-ng agent -c conf/ -n a3 -f job/job-avro-flume-dir.conf -Dflume.root.loggerINFO,console ⑦启动hadoop101上的flume任务job-file-flume-avro.conf - 命令 bin/flume-ng agent -c conf/ -n a1 -f job/job-file-flume-avro.conf -Dflume.root.loggerINFO,console ⑧启动hive ⑨查看监控结果 - 查看hdfs - 查看存储目录/opt/module/apache-flume-1.9.0/flume3下的文件 结语 至此关于Flume数据采集之复制和多路复用案例实战到这里就结束了我们下期见。。。。。。
http://www.hkea.cn/news/14572943/

相关文章:

  • 开微信小程序要钱吗常州网站建设优化
  • 基础很差去公司做网站徐州seo
  • 制作网页和网站的区别网站建设需要了解什么
  • 揭阳网站设计沈阳网站关键词排名
  • 北京网站优化平台深圳广电制作中心
  • 网站添加缩略图网站建设怎么找客源?
  • 网页设计网站页面搜索的代码wordpress 主题king
  • 搭建网站需要学什么wordpress评论人
  • 盛泽做网站的在线设计平台的概念
  • 厦门网站建设缑阳建淘宝运营培训课程
  • 国外html5做的音乐网站建设拍卖网站
  • 南宁网站开发企业wordpress文章类型查询
  • 图书馆网站建设总结好孩子官方网站王建设
  • 做网站前必须设计原型吗如何上传模板到网站
  • 加热器网站怎么做的wordpress自动语言
  • 凡科网建站怎么样网页设计效果图怎么做
  • 网站打开速度与服务器百度软件中心下载安装
  • 腾讯公司网站某绿色园林企业网站源码
  • 课程精品网站开发如何自建网站入口
  • 宁乡网站建设公司网站建设的威胁
  • 优秀网站开发公司宝坻网站建设
  • 公司找私人做网站百度网站认证官网
  • 自己做的网站怎么删除广州58同城招聘网最新招聘
  • 外贸网站整站程序响应式网站建设开发公司
  • 家具公司网站模板展示型企业网站例子
  • 沭阳建设网站wordpress用户数据备份
  • 网站必须天天更新吗台州网站推广排名
  • 电子商务网站技术方案做婚恋网站有哪些
  • 对二次网站开发的认识成都旅游景点排名前十名
  • Wix网站开发 工作室网站制作公司服务