当前位置: 首页 > news >正文

牡丹江林口县建设局网站seo优化是什么职业

牡丹江林口县建设局网站,seo优化是什么职业,济南市公共资源交易中心官网,重庆网站查询文章作者邮箱:yugongshiye@sina.cn 地址:广东惠州 ▲ 本章节目的 ⚪ 了解TELECOM项目的数据收集; ⚪ 了解TELECOM项目的数据清洗; ⚪ 了解TELECOM项目的数据导出; ⚪ 了解TELECOM项目的数据可视化; ⚪ 了解TELECOM项目的其他; 一、数据收集 1. 在实…文章作者邮箱:yugongshiye@sina.cn 地址:广东惠州 ▲ 本章节目的 ⚪了解TELECOM项目的数据收集; ⚪了解TELECOM项目的数据清洗; ⚪了解TELECOM项目的数据导出; ⚪了解TELECOM项目的数据可视化; ⚪了解TELECOM项目的其他; 一、数据收集 1. 在实际生产环境中,电信流量日志肯定不只是在一台服务器上产生,而是每一台服务器都会产生流量日志。所以此时,需要先搭建Flume的扇入流动模型,之后将收集到的数据传输到HDFS上进行存储。 2. 步骤: a. 在第二台和第三台服务器上来创建对应的目录用于存储日志(将第二台和第三台服务器当作是日志产生的服务器) 。 cd /home mkdir telecomlog b.进入对应的目录,将日志上传或者下载到指定目录下(实际过程中,日志肯定是实时产生的) 。 cd telecomlog/ #云主机的下载地址 wget http://bj-yzjd.ufile.cn-north-02.ucloud.cn/103_20150615143630_00_00_000_2.csv c.收集第二台和第三台服务器上的日志,将收集到的日志传输到第一台服务器上,进行数据的扇入。 cd /home/software/apache-flume-1.9.0-bin/data #编辑文件 vim telecomlog.conf #在文件中添加如下内容 a1.sources = s1 a1.channels = c1 a1.sinks = k1 # 日志是放在指定目录下的 # 所以此时监控指定目录下的变化 # 如果目录下产生了新的文件 # 需要收集这个新文件中的内容 a1.sources.s1.type = spooldir # 指定要监听的目录 a1.sources.s1.spoolDir = /home/telecomlog # 配置Channel a1.channels.c1.type = memory a1.channels.c1.capacity = 10000 a1.channels.c1.transactionCapacity = 1000 # 需要将收集到的数据发送到第一台服务器上 a1.sinks.k1.type = avro a1.sinks.k1.hostname = hadoop01 a1.sinks.k1.port = 8090 # 绑定 a1.sources.s1.channels = c1 a1.sinks.k1.channel = c1 d.数据收集到第一台服务器上之后,需要将收集到的数据写到HDFS上。 cd /home/software/apache-flume-1.9.0-bin/data/ #编辑文件 vim telecomlog.conf #在文件中添加如下内容 a1.sources = s1 a1.channels = c1 a1.sinks = k1 # 需要接收第二台和第三台服务器传输来的数据 a1.sources.s1.type = avro a1.sources.s1.bind = 0.0.0.0 a1.sources.s1.port = 8090 # 需要在数据中来添加一个时间戳 a1.sources.s1.interceptors = i1 a1.sources.s1.interceptors.i1.type = timestamp # 配置Channel a1.channels.c1.type = memory a1.channels.c1.capacity = 10000 a1.channels.c1.transactionCapacity = 1000 # 配置Sink # 需要将数据写到HDFS上,最好能够实现数据按天存储 a1.sinks.k1.type = hdfs # 指定数据在HDFS上的存储路径 a1.sinks.k1.hdfs.path = hdfs://hadoop01:9000/telecomlog/reporttime=%Y-%m-%d # 指定文件在HDFS上的存储类型 a1.sinks.k1.hdfs.fileType = DataStream # 指定文件的滚动时间间隔 a1.sinks.k1.hdfs.rollInterval = 3600 a1.sinks.k1.hdfs.rollSize = 0 a1.sinks.k1.hdfs.rollCount = 0 # 绑定 a1.sources.s1.channels = c1 a1.sinks.k1.channel = c1 e.启动HDFS。 start-dfs.sh f.启动第一台服务器上的Flume。 ../bin/flume-ng agent -n a1 -c ../conf -f telecomlog.conf - Dflume.root.logger=INFO,console g.启动第二台服务器和第三台服务器上的Flume。 ../bin/flume-ng agent -n a1 -c ../conf -f telecomlog.conf - Dflume.root.logger=INFO,console 二、数据清洗 1. 利用Flume将数据收集到了HDFS上,那么此时需要在Hive中建表来管理原始数据。 #启动YARN start-yarn.sh #进入HBase的安装目录的lib目录下 cd /home/software/hbase-2.4.2/lib #进入子目录 cd client-facing-thirdparty/ #重命名 mv commons-logging-1.2.jar commons-logging-1.2.bak mv log4j-1.2.17.jar log4j-1.2.17.bak mv slf4j-log4j12-1.7.30.jar slf4j-log4j12-1.7.30.bak #启动Hive的服务进程 hive --service metastore hive --service hiveserver2 #进入hive的客户端 hive #创建库 create database telecom; #使用这个库
http://www.hkea.cn/news/14561524/

相关文章:

  • 双桥网站建设深圳市龙华区网站建设
  • 网站刷流量会怎么样重庆今天刚刚发生的重大新闻
  • 男生跟男生做口视频网站行业网站建设运营
  • 网站重购淇县住房和城乡建设局网站
  • 网站检索功能怎么做呢移动终端开发
  • 移动网站建站视频教程wordpress下拉式菜单
  • 广州搜域网络提供专业的网站建设wordpress 小工具区
  • 公司网站域名备案对网站名称有要求或界定吗网站的内容规划怎么写
  • 电子商务网站建设的范围是什么意思建一个电商网站要多少钱
  • app手机网站制作注册公司需要什么条件吗
  • 九寨沟城乡建设官方网站网站建设2000元
  • 网站模板 phpcms网站到期续费要多少钱
  • 给网站加织梦后台html5 音乐网站
  • 门户网站建设 工具内蒙做网站
  • 做网站多钱一年同时做几个网站的seo
  • 定制摄影app和摄影网站的区别什么主题的网站容易做点
  • 网站产品展示单页模板谷歌字体wordpress主题
  • 成都网站建设优化企业排名友情链接赚钱
  • 关于网站建设的请示报告百度网站怎么建设的
  • 合肥建站公司seo网站建设张世勇
  • 洮南网站建设关于网站建设的画册
  • 部队网站建设设计wordpress主题搜索图标
  • 电商设计师和美工有什么区别太原seo团队
  • 有没有帮人做数学题的网站揭阳网站制作专业
  • 江西响应式网站制作wordpress利用视频引流
  • 国外有建站公司吗app拉新渠道商
  • o2o网站建设案例做电影网站违法
  • 嘉陵 建设 摩托车官方网站网页制作成品网站
  • 网站空间付款方式中英文网站设计
  • 怎么管理网站昆山网站优化公司