当前位置: 首页 > news >正文

网站开发技术文档包含网站设计与开发实验报告

网站开发技术文档包含,网站设计与开发实验报告,有模块传奇网站怎么做,wordpress 链接 中文需求 **文本推荐#xff1a;**有多个文本字符串#xff0c;如何设计一个简单的统计方法#xff08;从词频的角度设计#xff09;#xff0c;来计算出多个文本字符串两两之间的相似度#xff0c;并输出大于指定相似度阈值的文本 分析理解 使用Java实现文本相似度计算的…需求 **文本推荐**有多个文本字符串如何设计一个简单的统计方法从词频的角度设计来计算出多个文本字符串两两之间的相似度并输出大于指定相似度阈值的文本 分析理解 使用Java实现文本相似度计算的一种方法是通过构建词频向量并计算余弦相似度具体介绍如下简单易懂 代码实现 复杂粘贴可以直接运行 !-- 使用HanLP进行分词 --dependencygroupIdcom.hankcs/groupIdartifactIdhanlp/artifactIdversionportable-1.8.4/version/dependencyimport com.hankcs.hanlp.tokenizer.StandardTokenizer; import java.util.*; import java.util.stream.Collectors;public class ChineseTextRecommender {// 使用HanLP进行中文分词// 构建词频向量// 假设我们有两个文本文档我们想衡量它们的主题相似性。每个文档可以被表示为一个向量其中包含词频TF或TF-IDF值。// 文档A: the cat sat on the mat on the mat// 文档B: the cat and the dog played// 我们选择几个关键词the, cat, sat, on, mat, and, dog, played。每个词在文档中出现的次数词频可以构成一个向量。// 向量A: [2, 1, 1, 1, 2, 0, 0, 0]the, cat, sat, on, mat, and, dog, played// 向量B: [1, 1, 0, 0, 0, 1, 1, 1]public static MapString, Integer buildTermVector(String text) {ListString words StandardTokenizer.segment(text).stream().map(term - term.word).collect(Collectors.toList());MapString, Integer termVector new HashMap();for (String word : words) {termVector.put(word, termVector.getOrDefault(word, 0) 1);}return termVector;}// 计算余弦相似度public static double cosineSimilarity(MapString, Integer vectorA, MapString, Integer vectorB) {double dotProduct 0.0;double normA 0.0;double normB 0.0;for (String key : vectorA.keySet()) {dotProduct vectorA.get(key) * (vectorB.getOrDefault(key, 0));normA Math.pow(vectorA.get(key), 2);}for (String key : vectorB.keySet()) {normB Math.pow(vectorB.get(key), 2);}if (normA 0 || normB 0) {return 0.0;}return dotProduct / (Math.sqrt(normA) * Math.sqrt(normB));}// 推荐与指定文本相似度高的文本 texts为待判断文本列表public static ListString recommendTexts(ListString texts, String targetText, double threshold) {MapString, Double similarityScores new HashMap();MapString, Integer targetVector buildTermVector(targetText);for (String text : texts) {MapString, Integer textVector buildTermVector(text);double similarity cosineSimilarity(targetVector, textVector);similarityScores.put(text, similarity);System.out.println(text ----Similarity: similarity);}return similarityScores.entrySet().stream().filter(entry - entry.getValue() threshold).map(Map.Entry::getKey).collect(Collectors.toList());}public static void main(String[] args) {// 相似度分别为0.91 0.59 0.54 0.799 0.791ListString texts Arrays.asList(这是一个测试文档吗, 这是第二个文档, 这是第三个文档,这是一个文档吗,这是第一个测试文档吧哈哈);String targetText 这是一个测试文档;double threshold 0.8; // 理论上阈值在0.5左右都可以接受ListString recommendedTexts recommendTexts(texts, targetText, threshold);System.out.println(推荐文本:);recommendedTexts.forEach(System.out::println);} }输出结果
http://www.hkea.cn/news/14392250/

相关文章:

  • 怎么建立公司网站费用wordpress首页手机版
  • 张家界商城网站建设wordpress主题验证码
  • 网站搜索引擎怎么做表白网页
  • 如何做一家专门卖零食的网站河北网站建设seo优化制作设计
  • 8月4号建设部网站做房产中介网站
  • 苏州建站模板系统免费二维码推广平台
  • 仓库盘点网站开发注册自己的网站怎么注
  • 国内免费推广产品的网站wordpress 转义
  • 企业网站排名软件度智能优化北京低价做网站
  • 免费网站模板软件网站开发研究综述
  • 甘肃省住房和城乡建设厅官方网站转转钓鱼链接怎么制作
  • 免费行情软件app网站大全下载免费入口建设银行etc信用卡申请网站
  • 石家庄微网站好的建站平台
  • ppt模板免费下载网站哪个好微信电脑版
  • 做详情页比较好的网站网络营销实训报告
  • h5制作企业网站有哪些优势福田企业网站推广公司
  • 南京外贸网站建设报价wordpress同步至订阅号
  • 证书兼职的人才网站网页设计网站首页代码
  • 做微网站的公司哪家好呢如何优化网站目录结构
  • 10m带宽做下载网站网站结构分析具体分析内容
  • 网站授权协议兰州市住房建设局网站
  • 无人机网站建设如何从客户网站开发客户
  • 农村电子商务网站建设方案godaddy主机wordpress
  • 网站支付接口怎么做哪家公司可以做网站
  • 张店网站制作设计公司青岛关键词优化排名
  • 网站备案名称填写规则广州网站开发网络公司
  • 公司网站备案是什么意思哈尔滨招标信息网
  • 免费网页搭建宁波关键词优化时间
  • 商城属于电商网站吗企业网站首页设计评价
  • 温州英文网站建设电商是做什么的简易运营模式