当前位置: 首页 > news >正文

孝昌县专注网站建设代理娄底seo排名

孝昌县专注网站建设代理,娄底seo排名,企业网站系统设计,e网科技网站需求分析 关键词 统计关键词出现的频率 IK分词 进行分词需要引入IK分词器#xff0c;使用它时需要引入相关的依赖。它能够将搜索的关键字按照日常的使用习惯进行拆分。比如将苹果iphone 手机#xff0c;拆分为苹果#xff0c;iphone, 手机。 dependencygrou…需求分析 关键词 统计关键词出现的频率 IK分词 进行分词需要引入IK分词器使用它时需要引入相关的依赖。它能够将搜索的关键字按照日常的使用习惯进行拆分。比如将苹果iphone 手机拆分为苹果iphone, 手机。 dependencygroupIdorg.apache.doris/groupIdartifactIdflink-doris-connector-1.17/artifactId /dependencydependencygroupIdcom.janeluo/groupIdartifactIdikanalyzer/artifactId /dependency测试代码如下 public class IkUtil {public static void main(String[] args) throws IOException {String s Apple 苹果15 5G手机;StringReader stringReader new StringReader(s);IKSegmenter ikSegmenter new IKSegmenter(stringReader, true);//第二个参数表示是否再对拆分后的单词再进行拆分true时表示不在继续拆分Lexeme next ikSegmenter.next();while (next! null) {System.out.println(next.getLexemeText());next ikSegmenter.next();}} }整体流程 创建自定义分词工具类IKUtilIK是一个分词工具依赖创建自定义函数类注册函数消费kafka DWD页面主题数据并设置水位线从主流中过滤搜索行为 page[‘item’] is not nullitem_type : “keyword”last_page_id: “search” 使用分词函数对keyword进行拆分对keyword进行分组开窗聚合写出到doris 创建doris sinkflink需要打开检查点才能将数据写出到doris 具体实现 import com.atguigu.gmall.realtime.common.base.BaseSQLApp; import com.atguigu.gmall.realtime.common.constant.Constant; import com.atguigu.gmall.realtime.common.util.SQLUtil; import com.atguigu.gmall.realtime.dws.function.KwSplit; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.table.api.Table; import org.apache.flink.table.api.TableEnvironment;/*** title:** Author 浪拍岸* Create 28/12/2023 上午11:06* Version 1.0*/ public class DwsTrafficSourceKeywordPageViewWindow extends BaseSQLApp {public static void main(String[] args) {new DwsTrafficSourceKeywordPageViewWindow().start(10021,4,dws_traffic_source_keyword_page_view_window);}Overridepublic void handle(StreamExecutionEnvironment env, TableEnvironment tableEnv, String groupId) {//1. 读取主流dwd页面主题数据tableEnv.executeSql(create table page_info(\n common mapstring,string,\n page mapstring,string,\n ts bigint,\n row_time as to_timestamp_ltz(ts,3),\n WATERMARK FOR row_time AS row_time - INTERVAL 5 SECOND\n ) SQLUtil.getKafkaSourceSQL(Constant.TOPIC_DWD_TRAFFIC_PAGE, groupId));//测试是否获取到数据//tableEnv.executeSql(select * from page_info).print();//2. 筛选出关键字keywordsTable keywrodTable tableEnv.sqlQuery(select\n page[item] keywords,\n row_time,\n ts\n from page_info\n where page[last_page_id] search\n and page[item_type] keyword\n and page[item] is not null);tableEnv.createTemporaryView(keywords_table, keywrodTable);// 测试是否获取到数据//tableEnv.executeSql(select * from keywords_table).print();//3. 自定义分词函数并注册tableEnv.createTemporarySystemFunction(kwSplit, KwSplit.class );//4. 调用分词函数对keywords进行拆分Table splitKwTable tableEnv.sqlQuery(select keywords, keyword, row_time from keywords_table left join lateral Table(kwSplit(keywords)) on true);tableEnv.createTemporaryView(split_kw_table, splitKwTable);//tableEnv.executeSql(select * from split_kw_table).print();//5. 对keyword进行分组开窗聚合Table windowAggTable tableEnv.sqlQuery(select\n keyword,\n cast(tumble_start(row_time,interval 10 second ) as string) wStart,\n cast(tumble_end(row_time,interval 10 second ) as string) wEnd,\n cast(current_date as string) cur_date,\n count(*) keyword_count\n from split_kw_table\n group by tumble(row_time, interval 10 second), keyword);//tableEnv.createTemporaryView(result_table,table);//tableEnv.executeSql(select keyword,keyword_count1 from result_table).print();//6. 写出到doristableEnv.executeSql(create table doris_sink\n (\n keyword STRING,\n wStart STRING,\n wEnd STRING,\n cur_date STRING,\n keyword_count BIGINT\n ) SQLUtil.getDorisSinkSQL(Constant.DWS_TRAFFIC_SOURCE_KEYWORD_PAGE_VIEW_WINDOW));windowAggTable.insertInto(doris_sink).execute();} }
http://www.hkea.cn/news/14592476/

相关文章:

  • 怎么下载自己做的网站农畜产品销售平台的网站建设
  • 网站开源是什么意思网站备案信息不准确
  • kloxo网站压缩计算机培训班培训费用
  • 网站维护运营主要是做什么的旅游网站功能模块
  • 高新技术企业申报网站如何备份wordpress站点
  • 福州外文网站建设海南省建筑信息平台
  • 公司创建网站多少钱电子商务网站的设计与开发
  • 东港建站公司人才微网站开发
  • 个人网站怎么申请建设厅考试成绩查询
  • 推广项目网站杭州app开发公司老铁帮
  • 周宁县建设局网站太原网站建设公司哪家好
  • 企业云网站建设图案设计网
  • 网站建设_免费视频wordpress的搜索插件
  • 长沙制作手机网站的公司永州建设网站公司
  • 如何做餐饮的网站ppt背景图片
  • 做网站系统的销售怎么做怎么在自己电脑上做网站
  • 网站图片翻页怎么做门牌设计图片
  • 手机网站有哪些宏泰机械网站建设
  • 品划做网站昆明百度推广开户费用
  • 做非法网站怎样量刑企业网络营销策划方案书范例
  • 做直播网站要多少钱做推广怎么赚钱
  • 自己怎么建立微网站后台企业宣传册模板图片
  • 东莞好的网站建设公司免费自学网
  • 做公司的后台网站用什么软件好娱乐网站建设ppt
  • 网页站点的建立流程ui培训班学费多少
  • 网站举报有奖平台企业信息公示管理系统河南
  • 好用的在线地图网站seo搜索引擎优化哪家好
  • 花生壳 建设网站外贸网站建设双语网站建设
  • 西宁网站制作公司2021可以访问黄的浏览器
  • 邢台本地网站南京网络推广公司介绍