当前位置: 首页 > news >正文

新都区网站建设怎么建设网站容易被百度抓取

新都区网站建设,怎么建设网站容易被百度抓取,iis怎么给网站设置权限,做网站文案策划步骤1、事件时间#xff1a; 指的是数据产生的时间或是说是数据发生的时间。 在Flink中有三种时间分别是#xff1a; Event Time#xff1a;事件时间#xff0c;数据产生的时间#xff0c;可以反应数据真实发生的时间 Infestion Time#xff1a;事件接收时间 Processing Tim…1、事件时间 指的是数据产生的时间或是说是数据发生的时间。 在Flink中有三种时间分别是 Event Time事件时间数据产生的时间可以反应数据真实发生的时间 Infestion Time事件接收时间 Processing Time事件处理时间 为什么会提出事件时间这个概念 因为当使用Processing Time事件的处理时间来对数据进行处理此时数据可能会乱序没有办法还原数据本身的时间顺序这种情况在Flink中会可能导致数据丢失如果使用事件时间它会根据事件真实发生的时间对数据排序就不会出现数据乱序的情况。 总结来说数据产生的时间就是事件时间现实中实时的时间就是事件的处理时间 2、Processing Time 事件处理时间 处理时间是接收数据过后对数据操作的时间。处理时间的会按照实时的时间触发。 public class Demo03ProcessingTime {public static void main(String[] args) throws Exception{/*** 数据处理时间一般会结合窗口使用,一般值的是接受数据后对数据操作的时间* 需求每过5秒中统计15秒内的单词的数量*///构建Flink的环境StreamExecutionEnvironment env StreamExecutionEnvironment.getExecutionEnvironment();//使用socket模拟实时的操作DataStreamSourceString wordDS env.socketTextStream(master, 8888);//将接受的数据的转换成kv的格式SingleOutputStreamOperatorTuple2String, Integer kvDS wordDS.map(word - Tuple2.of(word, 1), Types.TUPLE(Types.STRING,Types.INT));//按照单词进行分组KeyedStreamTuple2String, Integer, String keyByDS kvDS.keyBy(key - key.f0);//划分窗口窗口的大小是10秒钟滑动的时间是5秒钟WindowedStreamTuple2String, Integer, String, TimeWindow windowDS keyByDS .window(SlidingProcessingTimeWindows.of(Time.seconds(10), Time.seconds(5)));//对统计的单词进行求和SingleOutputStreamOperatorTuple2String, Integer countDS windowDS.sum(1);countDS.print();//启动Flinkenv.execute();} } 3、事件时间 数据产生的时间就是事件时间不过在使用的时候使用的是时间戳。需要注意的是数据的时间与现实的时间是不一致的。 在使用事件时间的时候需要注意的是打入数据的数据时间是需要按照时间的顺序打入否则数据就会丢失也可以不按照顺序打入后面有解决办法 java,1699035731000 java,1699035732000 java,1699035735000 java,1699035733000 java,1699035736000 java,1699035737000 java,1699035740000例如上述数据总共有两个部分组成前面是单词后面的是单词数据产生的时间戳 public class Demo04EventTime {public static void main(String[] args) throws Exception{/*** 需求统计5秒内的单词的数量使用的是事件时间滚动窗口* 触发的条件是事件时间5秒*///构建flink的环境StreamExecutionEnvironment env StreamExecutionEnvironment.getExecutionEnvironment();//需要并行度改成一env.setParallelism(1);//使用socket模拟实时的环境DataStreamSourceString lineDS env.socketTextStream(master, 8888);/*** java,1699035731000* java,1699035732000* java,1699035735000* java,1699035733000* java,1699035736000* java,1699035737000* java,1699035740000*///此时的数据的格式并不是某一个单词需要告诉flink哪一个是事件时间//首先对数据进行格式处理SingleOutputStreamOperatorTuple2String, Long kvDS lineDS.map(line - {String[] split line.split(,);String word split[0]; // String time split[1];long time1 Long.parseLong(split[1]);return Tuple2.of(word, time1);}, Types.TUPLE(Types.STRING, Types.LONG));//告诉Flink哪一个是事件的时间SingleOutputStreamOperatorTuple2String, Long assDS kvDS.assignTimestampsAndWatermarks(WatermarkStrategy.Tuple2String, LongforBoundedOutOfOrderness(Duration.ofSeconds(5))//指定事件时间.withTimestampAssigner((kv, ts) - kv.f1));//统计5秒钟的单词的数量DataStreamTuple2String, IntegerkeyByDS assDS.map(kv - Tuple2.of(kv.f0, 1),Types.TUPLE(Types.STRING,Types.INT));//按照单词进行分组KeyedStreamTuple2String, Integer, String keyByDS1 keyByDS.keyBy(kv - kv.f0);//开窗WindowedStreamTuple2String, Integer, String, TimeWindow windowDS keyByDS1.window(TumblingEventTimeWindows.of(Time.seconds(5)));//对单词的数量进行统计SingleOutputStreamOperatorTuple2String, Integer countDS windowDS.sum(1);//打印数据countDS.print();//执行Flink的环境env.execute();} }1、基于事件时间来说触发窗口的条件 1、水位线需要大于等于窗口的结束时间2、窗口里面要存在数据3、窗口的划分时间是从1970年1月1日0时0分0秒开始的按照窗口的大小轮替 4、水位线(watermark)默认是等于最新的一条数据的时间戳 5、在使用事件时间的时候需要注意的是打入数据的数据时间是需要按照时间的顺序打入否则数据就会丢失也可以不按照顺序打入后面有解决办法 解决方法将水位线向后推移 假设一个时间窗口是5秒如果将此时的水位线向后推移5秒假设4进入的时候此时的水位线就变成-3但是此时就不满足触发窗口的条件此时假设遗漏的数据是3此时的水位线依旧是小于窗口的时间依旧不会触发窗口。 但是不能完全的保证数据不丢失推移的时间越久对于Flink的延迟就会越大。 1、在Flink中是默认使用的是单调递增的时间戳分配器在没有乱序情况下默认水位线是等于最新的一条数据的时间戳 //1、需要告诉flink哪一个字段是时间字段//设置时间字段和水位线DataStreamTuple2String, Long assDS wordAndTsDS.assignTimestampsAndWatermarks(WatermarkStrategy//1、指定水位线等于时间最新一条数据的时间戳数据不存在乱序的时候使用如果数据乱序可能会丢失数据.Tuple2String, LongforMonotonousTimestamps()//指定时间字段.withTimestampAssigner((kv, ts) - kv.f1)); 2、数据之间存在最大固定延迟的时间戳分配器在乱序的情况下就水位线先后推移固定的时间是以最新的一条数据的时间戳为标准的 //1、需要告诉flink哪一个字段是时间字段//设置时间字段和水位线DataStreamTuple2String, Long assDS wordAndTsDS.assignTimestampsAndWatermarks(WatermarkStrategy//1、水位线生成方式最新一条数据的时间戳减去5秒会导致计算延迟触发.Tuple2String,LongforBoundedOutOfOrderness(Duration.ofSeconds(5))//指定时间字段.withTimestampAssigner((kv, ts) - kv.f1)); 6、水位线的生成 上图表示的是以Flink的流程图图中总共有两个并行度每一个Task上面都带着任务的时间在Flink中会将任务的时间向后传递当途中上游map1将任务时间传递给下游window1时下面的上游map2也会任务时间传递给下游window1上游的任务是并行的此时下游window1就会产生两个任务时间此时就会选择时间最小的时间的作为水位线。因为当选择时间大的作为水位线那么对于时间较小的数据可能会丢失。 1、水位线对齐 因为上游的任务是并行执行的指的时对于上游的所有的Task的水位线都需要逐步的向后推移。
http://www.hkea.cn/news/14565801/

相关文章:

  • 做网站空间 阿里云懒懒淘客怎么做自己的网站
  • 在手机上做网站有的网站打开慢
  • 嘉兴网站建设方案策划赤坎手机网站建设公司
  • 电商网站新闻怎么做网站建设与规划
  • 自己如何高效有力的维护一个网站wordpress用来构建什么
  • 电商网站设计的原则wordpress 魔
  • 攸县网站定制关于网站开发的学校
  • 推广做网站南充做精彩网站分析的方向是
  • 网站排名查询软件电子商务学网站建设好吗
  • 铜陵网站制作电子商务网站开发设计案例—易趣网电子商务网站
  • 凡科建网站追波设计网站
  • 给人做网站能赚钱吗昆明市建设局官方网站
  • 深圳网站建设中为2023前端开发的就业现状
  • 怎样解除拦截网站设置做的网站怎么卖出去
  • 什么网站可以做高数番禺网站建设哪里好
  • 郑州网站建设联系方式网站建设与策划试卷
  • 网站建设的素材整理论文品牌内容包括哪些
  • 第二代营销网站网站有哪些内容
  • html5制作网站首页网站策划步骤
  • 郑州怎样建设公司网站wordpress敏感词大全
  • 做微信公众号微网站吗网站怎么开启gzip
  • 东营 微信网站建设微信小程序开发代码
  • 网站备案经验免费1级做爰网站
  • 建站网站赚钱吗网站建设推广多少钱
  • 九易建网站的建站模板电影网站cpa怎么做
  • 网站后端开发软件北京市建设工程教育考试网站
  • 手机视频网站设计中国建设网官方网站
  • 公司网站建设费用计入什么科目东莞政务网站建设方案
  • 中小企业网站建设新闻晋城住房保障和城乡建设管网站
  • 长沙建网站设计前端网页模板下载