当前位置: 首页 > news >正文

东莞网站制作推广公司河南网站建设yijuce

东莞网站制作推广公司,河南网站建设yijuce,做网站的是如何赚钱的,马鞍山网站建设哪里有基于之前关于文本聚类和文本模型的博客#xff0c;我们现在可以深入探讨一个经典主题 - 情感分析。情感分析通过计算方式识别和分类文本中的情感#xff0c;帮助理解公众意见或消费者反馈。 什么是情感分析#xff1f; 情感分析确定文本背后的情感基调#xff0c;将其分类…基于之前关于文本聚类和文本模型的博客我们现在可以深入探讨一个经典主题 - 情感分析。情感分析通过计算方式识别和分类文本中的情感帮助理解公众意见或消费者反馈。 什么是情感分析 情感分析确定文本背后的情感基调将其分类为积极、消极或中性。它被广泛用于社交媒体监控和理解消费者需求。 为什么使用情感分析 公众意见评估对话题或品牌的情绪。消费者洞察快速识别客户反应例如Expedia加拿大的商业案例。 挑战 人类语言很复杂机器在处理讽刺等细微差别时存在困难例如太好了可能被误读为积极。算法正在不断发展以处理这些情况但还不能达到100%的准确性。 情感分析流程 文本预处理 分词将文本分割成单词或短语。停用词过滤删除常见词如和、“的”。否定处理处理否定词如不好与不是不好。词干提取将词还原为词根形式如跑步到跑。 情感分类使用词典或算法分配极性积极/消极。情感评分量化情感强度考虑大写等因素如GOOD表示更强的情绪。 示例数据 文本情感喜欢悉尼的德国面包店…积极VivaLaLauren 我的也坏了…消极Mofette 太棒了愿原力与你同在…积极 R语言中的情感分析 使用R的tm、syuzhet和其他包我们可以预处理文本并分析情感。 预处理和词云 library(tm) library(SnowballC) library(wordcloud) library(RColorBrewer)# 用于情感分析的示例文本数据 text - c(我绝对喜欢这个产品它超出了我所有的期望运行完美。,服务太差了。我从未对一次购买如此失望过。,这个还行。不是很好但也不差。我想它能完成工作。,客服团队非常乐于助人几分钟内就解决了我的问题。太棒了,考虑到价格质量相当差。根据评论我期望会更好。,这是我今年买过的最好的东西。每一分钱都值得,我对发货延迟感到非常沮丧。产品很好但等待时间让人无法接受。,说明不够清晰但一旦我弄明白了产品就如描述的那样工作。,我不会向任何人推荐这个。完全浪费金钱和时间。,设计很漂亮使用非常方便。我对这次购买非常满意 )docs - Corpus(VectorSource(text)) toSpace - content_transformer(function(x, pattern) gsub(pattern, , x)) docs - tm_map(docs, toSpace, /) docs - tm_map(docs, toSpace, ) docs - tm_map(docs, content_transformer(tolower)) docs - tm_map(docs, removeNumbers) docs - tm_map(docs, removeWords, stopwords(english)) docs - tm_map(docs, removePunctuation) docs - tm_map(docs, stripWhitespace) docs - tm_map(docs, stemDocument)# 创建词-文档矩阵 dtm - TermDocumentMatrix(docs) dtm_m - as.matrix(dtm) dtm_v - sort(rowSums(dtm_m), decreasingTRUE) dtm_d - data.frame(word names(dtm_v), freqdtm_v)# 生成词云调整参数 # 设置图形边距下、左、上、右 par(mar c(0, 0, 0, 0)) # 移除所有边距# 创建新图形设置更大尺寸 png(wordcloud.png, width 10, height 8, units in, res 300) # 高分辨率set.seed(1234) wordcloud(words dtm_d$word, freq dtm_d$freq, min.freq 1,max.words 50,random.order FALSE, rot.per 0, # 不旋转scale c(4, 0.8), # 最大和最小词之间的比例colors brewer.pal(8, Dark2),vfont c(sans serif, plain),use.r.layout TRUE # 更好的布局算法 )dev.off() # 关闭设备# 显示保存的图像 if (requireNamespace(png, quietly TRUE) requireNamespace(grid, quietly TRUE)) {library(png)library(grid)if (file.exists(wordcloud.png)) {img - png::readPNG(wordcloud.png)grid::grid.raster(img)} else {warning(未找到词云图像。请检查文件路径。)} } else {warning(请安装png和grid包以显示词云。) }这段代码预处理文本去除噪音并在词云中可视化频繁出现的词。 情感评分 使用syuzhet进行不同词典的情感分析 library(syuzhet) library(ggplot2)# 使用多种方法进行情感评分 syuzhet_vector - get_sentiment(text, methodsyuzhet) bing_vector - get_sentiment(text, methodbing) afinn_vector - get_sentiment(text, methodafinn)# 比较前几个分数 rbind(sign(head(syuzhet_vector)),sign(head(bing_vector)),sign(head(afinn_vector)) )# 使用NRC进行情感分类 d - get_nrc_sentiment(text) td - data.frame(t(d)) td_new - data.frame(rowSums(td)) names(td_new) - count td_new - cbind(sentiment rownames(td_new), td_new)# 创建更具信息量的图表 ggplot(td_new, aes(x reorder(sentiment, count), y count, fill sentiment)) geom_bar(stat identity) theme_minimal() theme(axis.text.x element_text(angle 45, hjust 1),legend.position none) # 移除图例因为它是多余的labs(title 情感分析结果,x 情感,y 计数) scale_fill_brewer(palette Set3) coord_flip() # 翻转坐标以获得更好的可读性# 创建多个可视化 # 1. 基本情感分数比较 sentiment_scores - data.frame(Text 1:length(text),Syuzhet syuzhet_vector,Bing bing_vector,Afinn afinn_vector )# 重塑数据以便绘图 sentiment_long - tidyr::pivot_longer(sentiment_scores, cols c(Syuzhet, Bing, Afinn),names_to Method,values_to Score)# 图表1比较不同的情感评分方法 p1 - ggplot(sentiment_long, aes(x Text, y Score, fill Method)) geom_bar(stat identity, position dodge) theme_minimal() labs(title 情感评分方法比较,x 文本样本,y 情感分数) scale_fill_brewer(palette Set2)# 图表2NRC情感分析上面已创建 p2 - ggplot(td_new, aes(x reorder(sentiment, count), y count, fill sentiment)) geom_bar(stat identity) theme_minimal() theme(axis.text.x element_text(angle 45, hjust 1),legend.position none) labs(title 情感分析结果,x 情感,y 计数) scale_fill_brewer(palette Set3) coord_flip()# 图表3词云上面已创建 # 词云已保存为wordcloud.png# 显示所有图表 print(p1) print(p2)# 打印汇总统计 cat(\n情感分数汇总\n) print(summary(sentiment_scores[, -1]))# 打印最积极和最消极的文本 cat(\n最积极的文本\n) print(text[which.max(syuzhet_vector)]) cat(\n最消极的文本\n) print(text[which.min(syuzhet_vector)])情感分数汇总Syuzhet Bing Afinn Min. :-1.750 Min. :-2.00 Min. :-5.00 1st Qu.:-0.250 1st Qu.: 0.00 1st Qu.:-0.75 Median : 0.325 Median : 0.00 Median : 1.50 Mean : 0.600 Mean : 0.80 Mean : 2.20 3rd Qu.: 1.738 3rd Qu.: 2.75 3rd Qu.: 5.75 Max. : 3.150 Max. : 4.00 Max. :10.00 最积极的文本 [1] 客服团队非常乐于助人几分钟内就解决了我的问题。太棒了最消极的文本 [1] 我对发货延迟感到非常沮丧。产品很好但等待时间让人无法接受。这段代码使用syuzhet、bing和afinn词典进行情感评分并使用NRC词典可视化情感如喜悦、悲伤。 基于词典的分析 像bing和afinn这样的词典为词分配情感分数 Bing二元积极/消极例如放弃消极。Afinn数值分数例如放弃-2。NRC对情感进行分类愤怒、喜悦等。 示例酒店情感分数 酒店Agoda情感Agoda评分Booking.com情感Booking.com评分One World6.858.56.598.5Summer Suite7.278.47.18.7 这些分数反映了评论的整体情感通常与评分一致但提供了更深层次的情感洞察。 结论 情感分析提供了一种强大的方式来理解文本中的情感尽管由于语言的复杂性需要谨慎解释。使用R的tm和syuzhet包你可以预处理文本、评分情感并可视化情绪使其成为社交媒体或评论分析的理想工具。
http://www.hkea.cn/news/14519799/

相关文章:

  • 景区微网站 建设方案网站服务器买了后怎么做的
  • seo排名工具站长网站实名审核多久
  • 网站建设包含内容自己的wordpress
  • 做那个网站的图客比较好提高网站收录
  • 无锡做网站公司多少钱旅游网站建设项目报告论文
  • 网站建设学习视频网络营销赚钱
  • 万链网站做的怎么样?百度seo服务方案
  • 个体户可以注册网站建设服务wordpress主题DUX大前端
  • 如何防止网站攻击wordpress使用七牛防止降权
  • 自己做的网站出现广告盘锦市建设银行网站
  • wordpress 站内信插件seo和sem是什么意思
  • 求职网站开发多少钱地方o2o同城网站源码
  • 坪山公司网站建设公司网站费用构成需要多少钱
  • 郴州网站建设案例网站开发维护公司经营范围
  • 课程设计代做网站推荐领优惠券的小网站怎么做
  • 软件开发工资一般多少钱一个月做关键词优化的公司
  • 北京公司模板网站专业做生鲜的网站
  • 承德网站建设报价浦东新区办营业执照哪里办
  • 微信公众号和网站建设的意义seo优化包括什么
  • 城市建设与管理网站新浪云sae免费wordpress网站
  • 礼品网站建设公司百度招聘
  • 专业公司网站建设服务公司免费wordpress资源
  • 搭建网站难吗企业网站建设介绍
  • 网站建设的公司哪家强网站开发语言有什么
  • 网站素材免费如何建设数据报表网站
  • 山西省轻工建设有限责网站海口发布公众号
  • 网站建设关健词优化网络公司怎么样网站后台设置网站地图
  • 美词网站建设社交网络服务网站
  • 做那个的网站网站建设哪家好公司
  • wordpress 多语言网站html5网站模板