当前位置: 首页 > news >正文

大学做兼职英语作文网站点击下载app安装

大学做兼职英语作文网站,点击下载app安装,中国作风建设门户网站,自己可以做网站吗什么是Flink Flink是一个分布式的、高性能的、可伸缩的、容错的流处理引擎#xff0c;它支持批处理和流处理#xff0c;并提供了丰富的 API 和库#xff0c;是实时数据处理的理想选择 由Java 和 Scala 实现的#xff0c;所以所有组件都会运行在Java 虚拟机【单个JVM也可以】…什么是Flink Flink是一个分布式的、高性能的、可伸缩的、容错的流处理引擎它支持批处理和流处理并提供了丰富的 API 和库是实时数据处理的理想选择 由Java 和 Scala 实现的所以所有组件都会运行在Java 虚拟机【单个JVM也可以】上 不需要依赖于hadoop集群的组件优缺点 优点 事件驱动型。Flink的事件驱动型应用是一类具有状态的应用它从一个或多个事件流提取数据并根据到来的事件触发计算、状态更新或其他外部动作。 高吞吐、低延迟、高性能。Flink被设计在所有常见的集群环境中运行以内存执行速度和任意规模来执行计算。 强大的容错机制。Flink使用两阶段提交协议来解决容错问题。 缺点 Flink的API较难使用。 Flink的社区相对较小。应用场景 事件驱动的应用Flink应用每接受一条数据就会处理一条数据处理之后就会触发一个动作同时也可以将处理结果写入外部消息队列中其他Flink应用再消费。 智能推荐 根据用户历史的购买行为通过推荐算法训练模型预测用户未来可能会购买的物品。【例如实时统计每隔1秒统计最近2秒单词出现的次数可以直接使用Flink训练的API】 复杂事件处理 比较常见的案例主要集中于工业领域例如对车载传感器、机械设备等实时故障检测。 实时计算 实时监控、实时报表实时化采集、加工流式数据存储、流数据分析、实时仓库。架构组件 作业管理器JobManager 控制一个应用程序的主进程每个应用程序都会被一个不同的JobManager 所控制执行。JobManager 会向资源管理器ResourceManager请求执行任务必要的资源也就是任务管理器TaskManager上的插槽slot。一旦它获取到了足够的资源就会将执行图分发到真正运行它们的TaskManager 上。而在运行过程中JobManager 会负责所有需要中央协调的操作比如说检查点checkpoints的协调。 资源管理器ResourceManager 负责管理任务管理器TaskManager的插槽slotTaskManger 插槽是 Flink 中定义的处理资源单元。Flink 为不同的环境和资源管理工具提供了不同资源管理器比如YARN、Mesos、K8s以及 standalone 部署。当 JobManager 申请插槽资源时ResourceManager会将有空闲插槽的 TaskManager 分配给 JobManager。如果 ResourceManager 没有足够的插槽来满足 JobManager 的请求它还可以向资源提供平台发起会话以提供启动 TaskManager进程的容器。另外ResourceManager 还负责终止空闲的 TaskManager释放计算资源。 任务管理器TaskManager 是一个工作进程,通常在 Flink 中会有多个 TaskManager 运行每一个 TaskManager都包含了一定数量的插槽slots。插槽的数量限制了 TaskManager 能够执行的任务数量。启动之后TaskManager 会向资源管理器注册它的插槽收到资源管理器的指令后TaskManager 就会将一个或者多个插槽提供给 JobManager 调用。JobManager 就可以向插槽分配任务tasks来执行了。在执行过程中一个 TaskManager 可以跟其它运行同一应用程序的 TaskManager 交换数据。 分发器Dispatcher 负责接收用户提交的作业并且将作业提交给作业管理器。工作原理 自身 ①由应用端(App)提交应用给分发器(dispatcher) ②Dispatcher启动并提交应用给JobManager ③JobManager向resourcemanager请求slots(插槽)资源 ④resourcemanager收到了JobManager的资源请求后就去启动TaskManager ⑤TaskManger启动之后会去resourcemanager注册slots ⑥resourcemanager收到TaskManger的注册slots请求后会给TaskManger发出提供slot的指令 ⑦TaskManager接到指令后JobManager会被告知已有所需数量的slots使用。 ⑧JobManager得知有足够的slots可以使用后就会提交要执行的任务给TaskManager ⑨与此同时TaskManager之间也会进行数据的交换 依赖于Hadoop集群的Yarn ①Flink客户端上传flink的jar包和配置到HDFS ②客户端提交job到resourcemanager(yarn) ③resourcemanager启动ApplicationMaster同时ApplicationMaster启动JobManager之后jobmanager从HDFS上加载Flink的jar包和配置环境(除了yarn的resourcemanagerflink也有自己的resourcemanager只不过它不管理资源而是由yarn的resourcemanager管理资源) ④jobmanager向resourcemanager申请资源 ⑤jobmanager申请到资源后启动TaskManager同样TaskManager向flink的ResourceManager注册slot因此jobmanager得知有足够的slots可以使用就会将job任务提交给TaskManager去执行同时taskmanager会从HDFS加载flink的jar包和环境配置。基本概念 处理无界和有界数据 无界流 有定义流的开始但没有定义流的结束。它们会无休止地产生数据。无界流的数据必须持续处理即数据被摄取后需要立刻处理。我们不能等到所有数据都到达再处理因为输入是无限的在任何时候输入都不会完成。处理无界数据通常要求以特定顺序摄取事件例如事件发生的顺序以便能够推断结果的完整性。 有界流 有定义流的开始也有定义流的结束。有界流可以在摄取所有数据后再进行计算。有界流所有数据可以被排序所以并不需要有序摄取。有界流处理通常被称为批处理常踩的坑 数据延迟当外部组件往Kafka topic在写数据而同时Flink正在消费这个topic的数据如果外部组件出现问题就会发生数据晚到的现象。 乱序数据由于Flink能通过延迟水印来支持乱序所以即使数据出现乱序Flink也可以处理。 日志记录过多在处理窗口时需要测量花费的时间只要计算窗口所需的时间超过1分钟就记录下所有可能的数据过多的记录会降低性能。 卡住作业的调查需要找到一种简单的方法来定位作业疑似卡住时当前正在运行的代码段。初学者 Flink Shell 开发的时候容易出错如果每次都打包进行调试比较麻烦并且也不好定位问题可以在scala shell命令行下进行调试
http://www.hkea.cn/news/14479339/

相关文章:

  • 苏州高端网站建设企业作业页面设计模板
  • 网站设计的原则有哪些wordpress latex公式
  • 怎样建立网站快捷方式莘县住房建设局网站
  • 厦门手机网站建设是什么梅江区建设局网站
  • 深圳做网站在去那备案有没有卖设计的网站
  • 主机怎么做网站二次跳转跨境电商数据在哪个官网查
  • 网站建设必要性在线代理浏览器网站
  • 网站建设方案解救苏州久远网络jquery个人网站开发
  • 衡阳网站建设icp备网站英文域名
  • 中学教材数字化学习资源的建设——教材配套网站的设计及发展趋势泗县口碑营销互联网营销推荐咨询
  • 南通公司做网站怎样建设微网站
  • 洛阳建站公司效果wordpress注册用户验证
  • 公司网站建设的项目工作分解结构网站动画特效
  • 免费建工作室网站软件开发外包大概多少钱
  • 网站教育培训机构排名政务公开与网站建设的矛盾
  • 温州网站建设定制手机网站设计欣赏
  • 网站建设的收费影视传媒宣传片
  • 网络网站设计培训商丘软件开发
  • 做网站公司销售开场白官方微网站吗
  • 网站商场系统软件如何让百度抓取网站
  • 网站开发工作总结wordpress流量统计插件
  • 蒙古文网站建设工作情况汇报wordpress nodejs版本
  • 响应式网站建设视频教程常用的搜索引擎有哪些?
  • 网站前端页面设计竹子建站模板怎么下载
  • 做网站 视频加载太慢新网域名续费
  • 公司网站搜索引擎优化wordpress 为什么要ftp
  • 郑州手机网站建设站长工具whois查询
  • 郑州可以做网站的公司h5个人网站模板源码
  • 网站建设参考书网络摄像头定制开发
  • 汝阳县建设局网站广东新闻发布会