当前位置: 首页 > news >正文

腾讯云10g数字盘做网站够么深圳建设局网站首页

腾讯云10g数字盘做网站够么,深圳建设局网站首页,什么网站做全景效果图好,网站开发asp.net我们有时候需要爬取结果生成为自定义的词云图 生成自定义的词云图通常需要以下步骤#xff1a; 1. 爬取数据#xff1a;使用爬虫工具或库#xff0c;如requests、BeautifulSoup等#xff0c;可以爬取网页、论坛、社交媒体等平台上的文本数据。 2. 数据预处理#xff1a…我们有时候需要爬取结果生成为自定义的词云图 生成自定义的词云图通常需要以下步骤 1. 爬取数据使用爬虫工具或库如requests、BeautifulSoup等可以爬取网页、论坛、社交媒体等平台上的文本数据。 2. 数据预处理对爬取到的文本数据进行清洗和处理去除无用字符、标点符号、停用词等并进行分词操作。 3. 构建词频字典统计每个词的出现频率可以使用字典或Counter类记录每个词的频率。 4. 生成词云图使用词云生成工具如wordcloud库根据词频字典生成词云图。可以根据需求设置词云的样式、颜色、形状等。 需要根据具体的需求对代码进行修改和完善如数据预处理、词频统计等。另外还可以根据需求自定义词云的样式、颜色、字体等。 需要导入的库先pip安装一下 # 导入扩展库 import re # 正则表达式库 import collections # 词频统计库 import numpy as np # numpy数据处理库 import jieba # 结巴分词 import wordcloud # 词云展示库 from PIL import Image # 图像处理库 import matplotlib.pyplot as plt # 图像展示库 from pylab import mpl # 用于处理中文乱码 读取保存到csv的爬取结果根据 # 读取文件 fn open(all_data.csv, encodingutf-8-sig) # 打开文件并编码 string_data fn.read() # 读出整个文件 fn.close() # 关闭文件# 文本预处理 pattern re.compile(u\t|\n|\.|-|:|;|\)|\(|\?|) # 定义正则表达式匹配模式 string_data re.sub(pattern, , string_data) # 将符合模式的字符去除# 文本分词 seg_list_exact jieba.cut(string_data, cut_allFalse) # 精确模式分词 object_list [] remove_words [u的, u, u和, u是, u随着, u对于, u对, u等, u能, u都, u。, u , u、, u中, u在, u了,u通常, u如果, u我们, u需要, u把, u但, u?, u!, u..., u有, u做, u大, u一个, u一些, u,u》, u, u】, u[, u【, u, u我, u你, u, u。。。, u《, u1, u/, u, u吗, u“,u这, u小, u., u#, u|, u(, u), u, u, u…, u”, u,, u不, u上] # 自定义去除词库for word in seg_list_exact: # 循环读出每个分词if word not in remove_words: # 如果不在去除词库中object_list.append(word) # 分词追加到列表# 词频统计 word_counts collections.Counter(object_list) # 对分词做词频统计 word_counts_top10 word_counts.most_common(10) # 获取前10最高频的词 print(word_counts_top10) # 输出检查# 词频展示 mask np.array(Image.open(tree.jpg)) # 定义词频背景 wc wordcloud.WordCloud(font_pathD:/Course/bilibiliHot/JiZiHeFengChiSong.ttf, # 设置字体格式maskmask, # 设置背景图max_words200, # 最多显示词数max_font_size100, # 字体最大值background_colorwhite# 设置背景颜色,默认为黑色black )fig plt.figure(figsize(10, 8)) # 设置显示窗口大小 wc.generate_from_frequencies(word_counts) # 从字典生成词云 image_colors wordcloud.ImageColorGenerator(mask) # 从背景图建立颜色方案 wc.recolor(color_funcimage_colors) # 将词云颜色设置为背景图方案 mpl.rcParams[font.sans-serif] [SimHei] plt.suptitle(词频分析) #这里设置中文可能会乱码需要导包 plt.imshow(wc) # 显示词云 plt.axis(off) # 关闭坐标轴 plt.show() # 显示图像 wc.to_file(result.jpg) # 无白边保存图片 # fig.savefig(result01.jpg) # 有白边保存
http://www.hkea.cn/news/14403023/

相关文章:

  • wordpress 建站 电子书网页升级访问站
  • 在网站建设工作会议上的讲话公司网址正确格式
  • 深圳 企业网站建设wordpress vps 配置
  • 嘉兴高端建站公司wordpress需要付费才能看某些页面
  • 优仔电话手表网站深圳做网站网络公司怎么样
  • 地方门户网站建设要求企业在建设银行网站怎么发工资
  • 有没有免费注册的网站网站上官网标识怎么做
  • 苏州网站建设找苏州聚尚网络首选安阳最好的网络推广公司
  • 创建个人网站英文人力资源公司起名大全册子
  • 做网站的计划申请备案网站首页
  • 临漳手机网站建设网站设计宽屏
  • 广东品牌网站设计专家青浦网站建设su35
  • 前段模板的网站门户网站建设运行环境要求
  • 静态页面网站怎么做网站建设项目预算
  • 绵阳专业网站建设公司建设中英文网站
  • 江苏省交通运输厅门户网站建设管理网站首页制作教程
  • 做社区网站用什么程序好什么网站权重大
  • 广州哪家做网站还可以阿里巴巴网页版
  • 会计公司网站模板德吉机械东莞网站建设
  • 购物网站开发英文文献服务器租用多少钱一台
  • wordpress优化版模板整站优化cms
  • 兼职做视频的网站怎么做网页下载链接
  • 怎么做盗版网站赚钱游戏广告投放平台
  • asp.net mvc网站开发做美团团购网站
  • 做移门图的 网站有哪些义乌网站建设公司排名
  • 网站建设方面的课程北京建设工程建设交易信息网站
  • 湘潭网站建设 磐石网络荣誉新开三端互通传奇网站
  • 哪个网站做二手车买卖成都交易网站建设
  • 网站建设怎么更换图片北仑建设局网站
  • 百度地图 添加到网站公司如何做网站宣传