当前位置: 首页 > news >正文

做一小说网站要花多钱wordpress 小说网站

做一小说网站要花多钱,wordpress 小说网站,canvas设计网站,优化方案的格式及范文What’s Flink-cdc? Flink CDC 是基于Apache Flink的一种数据变更捕获技术#xff0c;用于从数据源#xff08;如数据库#xff09;中捕获和处理数据的变更事件。CDC技术允许实时地捕获数据库中的增、删、改操作#xff0c;将这些变更事件转化为流式数据#xff0c;并能够…What’s Flink-cdc? Flink CDC 是基于Apache Flink的一种数据变更捕获技术用于从数据源如数据库中捕获和处理数据的变更事件。CDC技术允许实时地捕获数据库中的增、删、改操作将这些变更事件转化为流式数据并能够对这些事件进行实时处理和分析。 Flink CDC提供了与各种数据源集成的功能包括常见的关系型数据库如MySQL、PostgreSQL、Oracle等以及NoSQL数据库如MongoDB、HBase等。它通过监控数据库的日志或轮询方式来捕获数据变更并将变更事件作为数据流发送到Flink的任务中进行处理。 Flink CDC 深度集成并由 Apache Flink 驱动提供以下核心功能 ✅ 端到端的数据集成框架 ✅ 为数据集成的用户提供了易于构建作业的 API ✅ 支持在 Source 和 Sink 中处理多个表 ✅ 整库同步 ✅具备表结构变更自动同步的能力Schema Evolution 在使用者的角度就是Flink-cdc可以简化流处理的流程: 引入Flink-cdc之前流处理流程 引入Flink-cdc之后后流处理流程 如上所示在flink-cdc被引入后大大简化了流处理流程 Flink-cdc支持的链接及对应的版本 Pipeline Connectors Source Connectors 截止目前2024-05-23 Flink-cdc与Flink对应对影版本的关系 截止目前2024-05-23 flink-connector-mysql-cdc 实例分析 示例代码 demo代码 import com.ververica.cdc.connectors.mysql.source.MySqlSource; import com.ververica.cdc.connectors.mysql.table.StartupOptions; import com.ververica.cdc.debezium.JsonDebeziumDeserializationSchema; import org.apache.flink.api.common.eventtime.WatermarkStrategy; import org.apache.flink.runtime.state.hashmap.HashMapStateBackend; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;public class MySqlSourceDemo {public static void main(String[] args) throws Exception {MySqlSourceString mySqlSource MySqlSource.Stringbuilder().hostname(mysql-server-host).port(3306).databaseList(mydb) // 设置捕获的数据库.tableList(mydb.products) // 设置捕获的表,如果需要同步整个数据库请将 tableList 设置为 .*. // .tableList(.*) // 捕获整个数据库的表 // .tableList(^(?!mysql|information_schema|performance_schema).*) // 设置捕获的表排除系统库 // .tableList(mydb.(?!products|orders).*) // 同步排除products和orders表之外的整个my_db库.username(flink-cdc).password(xxx).serverId(5400-5405).deserializer(new JsonDebeziumDeserializationSchema()) // 将 SourceRecord 转换为 JSON 字符串.serverTimeZone(Asia/Shanghai) // 设置时区.startupOptions(StartupOptions.initial()).scanNewlyAddedTableEnabled(true) // 启用扫描新添加的表功能 // .includeSchemaChanges(true) // 包括 schema 变更.build();org.apache.flink.configuration.Configuration config new org.apache.flink.configuration.Configuration();config.setString(rest.port, 8081); // StreamExecutionEnvironment env StreamExecutionEnvironment.createLocalEnvironment(config); //本地环境调试用StreamExecutionEnvironment env StreamExecutionEnvironment.getExecutionEnvironment();// 设置 3s 的 checkpoint 间隔env.enableCheckpointing(3000);env.setStateBackend(new HashMapStateBackend());env.getCheckpointConfig().setCheckpointStorage(file:///tmp/ck);//本地文件系统 // env.getCheckpointConfig().setExternalizedCheckpointCleanup(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION); 1.14.0 版本开始支持env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);env.fromSource(mySqlSource, WatermarkStrategy.noWatermarks(), MySQL Source)// 设置 source 节点的并行度为 4.setParallelism(5).print().setParallelism(1); // 设置 sink 节点并行度为 1env.execute(Print MySQL Snapshot Binlog);} } maven依赖 propertiesmaven.compiler.source8/maven.compiler.sourcemaven.compiler.target8/maven.compiler.targetproject.build.sourceEncodingUTF-8/project.build.sourceEncodingflink.version1.14.5/flink.versionscala.binary.version2.12/scala.binary.version/propertiesdependenciesdependencygroupIdjunit/groupIdartifactIdjunit/artifactIdscopetest/scope/dependency!-- 将 Apache Flink 的 Web 运行时模块添加到项目中 --dependencygroupIdorg.apache.flink/groupIdartifactIdflink-runtime-web_${scala.binary.version}/artifactIdversion${flink.version}/versionscopeprovided/scope/dependencydependencygroupIdorg.apache.flink/groupIdartifactIdflink-clients_${scala.binary.version}/artifactIdversion${flink.version}/versionscopeprovided/scope !--provided生命周期在test模式才可以运行在main模式会找不到包--/dependencydependencygroupIdcom.ververica/groupIdartifactIdflink-connector-mysql-cdc/artifactIdversion2.3.0/versionscopecompile/scope/dependencydependencygroupIdorg.apache.flink/groupIdartifactIdflink-table-common/artifactIdversion${flink.version}/versionscopecompile/scope/dependencydependencygroupIdorg.slf4j/groupIdartifactIdslf4j-log4j12/artifactIdversion1.7.25/versionscopeprovided/scope/dependency/dependencies日志配置文件 log4j.properties log4j.rootCategoryerror,stdout log4j.appender.stdoutorg.apache.log4j.ConsoleAppender log4j.appender.stdout.targetSystem.out log4j.appender.stdout.layoutorg.apache.log4j.PatternLayout log4j.appender.stdout.layout.ConversionPattern%d{yyyy-MM-dd HH:mm:ss} %p %c{1}:%L - %m%n 启动standalone Flink级群 # jobmanager docker run -d \ --name flink-jm \ --hostname flink-jm \ -p 8082:8081 \ --env FLINK_PROPERTIESjobmanager.rpc.address: flink-jm \ --network flink-network-standalone \ ponylee/flink:1.15.0-java8 \ jobmanager# taskmanager docker run -d \ --name flink-tm \ --hostname flink-tm \ --env FLINK_PROPERTIESjobmanager.rpc.address: flink-jm \ --network flink-network-standalone \ ponylee/flink:1.15.0-java8 \ taskmanager \ -Dtaskmanager.memory.process.size1024m \ -Dtaskmanager.numberOfTaskSlots5 \ -Drest.flamegraph.enabledtrue 分析说明 为每个 Reader 设置不同的 Server id 每个用于读取 binlog 的 MySQL 数据库客户端都应该有一个唯一的 id称为 Server id。 MySQL 服务器将使用此 id 来维护网络连接和 binlog 位置。 因此如果不同的作业共享相同的 Server id 则可能导致从错误的 binlog 位置读取数据。 因此建议通过为每个 Reader 设置不同的 Server id , 假设 Source 并行度为 4server id 配置必须serverId(“5400-5405”)5405-54005 4。来为 4 个 Source readers 中的每一个分配唯一的 Server id。 查看mysql链接发现 select * from information_schema.processlist where user ‘flink-cdc’; Flink-cdc对mysql的影响 正常情况下Flink-cdc是No-lock Read主库可以继续处理事务和查询而不会导致主库进程阻塞不会对主库产生直接影响。但是在某些情况下数据同步的过程中可能会对主库产生一些间接影响比如网络、IO、CPU负载以及mysql的并发连接数等资源消耗。但这些对主库的开销影响相对较小全量同步阶段可能比较耗能但时间相对比较短。 从上图mysql资源使用情况来看flink-cdc对内存和CPU负载影响微乎极微是No-lock Read主要表现对网络和IO的资源消耗。 断点续传 通过从checkpoint/savepoint 恢复flink-cdc可以保证断点续传。 从checkpoint/savepoint恢复缩小同步范围例如从tableList(“mydb.products,mydb.orders”)或tableList(“.*”) 缩小到 tableList(“mydb.products”)应用更新生效。 应用从checkpoint/savepoint恢复扩大同步范围的部分不会生效例如从tableList(“mydb.products”) 到 tableList(“mydb.products,mydb.orders”)或tableList(“.*”)应用更新不生效生效。若想使动态加表生效可以显示制定scanNewlyAddedTableEnabled(true) 来启用扫描新添加的表功能。如没有特殊情况建议在开发环境开启此配置。 flink-cdc包名变更 Flink CDC 项目 从 2.0.0 版本将 group id 从com.alibaba.ververica 改成 com.ververica, 自 3.1 版本从将 group id 从 com.ververica 改成 org.apache.flink。 这是为了让项目更加社区中立让各个公司的开发者共建时更方便。所以在maven仓库找 2.x 的包时路径是 /com/ververica找3.1及以上版本的包时路径是/org/apache/flink 参考 flink-cdc flink-cdc docs
http://www.hkea.cn/news/14322316/

相关文章:

  • 重庆最新情况 最新消息网站网站怎么优化关键词排名
  • 最好的dm单网站建设永嘉县住房建设局网站
  • 河北省建设局网站首页企业计划书怎么写
  • 网站备案 湖北怎么做网页制作网站模板
  • 河源和平县建设局网站百度关键词排名原理
  • 网站宣传册怎么做丹徒网站建设多少钱
  • 网站图怎么做会高清网络销售网站有哪些
  • 一个公司多个网站做优化优质院校 建设网站
  • 西宁做网站的好公司wordpress+pdo+mysql扩展
  • 天津市建设执业资格注册中心网站应聘ui设计师自我介绍
  • 做医药商城网站的公司吗机票售票网站开发
  • 电商网站建设懂你所需自建站成本
  • 网站主机注册做网站应该买什么服务器
  • 做编程的网站有哪些内容桂林市天气预报15天
  • 网站开发注册流程以及收费莒县城阳网站建设
  • 四川集团网站建设海南网络电视台
  • 机关门户网站建设要求设计新闻发布网站模板
  • 优书网书库完备的常州网站优化
  • 个人怎么制作网站湖北网站开发培训
  • 赣州营销型网站策划wordpress数据库中文
  • 茂名公司网站开发网络营销与电子商务的关系
  • 建设医院网站ppt模板学习php网站开发
  • 网站建设有哪些渠道在哪可以建一个网站
  • 盘锦做网站选哪家郑州市网站制作公司
  • 建立网站的基本步骤关键词语有哪些
  • 唐山设计网站公司网站建设专题
  • 山西省城乡建设厅网站如何做网站实名认证
  • lnmp wordpress 404seo综合查询怎么用
  • 网站制作的服务商欧美做爰爰爰爰网站
  • 做外贸网站需要注意些什么房产信息网网址