当前位置: 首页 > news >正文

j昆明网站制作公司重庆网站建设培训机构

j昆明网站制作公司,重庆网站建设培训机构,wordpress 3.8 下载,白杨seo数据的截图#xff0c;数据的说明#xff1a; # 字段 数据类型 # 城市 string # 名称 string # 星级 string # 评分 float # 价格 float # 销量 int # 省/市/区 string # 坐标 string # 简介 string # 是否免费 bool # 具体地址 string拿到数据… 数据的截图数据的说明 # 字段 数据类型 # 城市 string # 名称 string # 星级 string # 评分 float # 价格 float # 销量 int # 省/市/区 string # 坐标 string # 简介 string # 是否免费 bool # 具体地址 string 拿到数据第一步我们先导入数据查看一下数据的分布类型等 import pandas as pd import numpy as np import matplotlib.pyplot as pltdata pd.read_excel(旅游景点.xlsx) pd.set_option(display.max_columns,100) # print(data.head())print(data.info()) print(data.isnull().sum()) 接下来我们来看具体的问题 # 问题先大概分析一下 # 1、全国景点分布 我们分析城市的分布即可 # 2、国民出游分析 我们可以分析评分城市销量之间的关系 # 3、景区价格分析 我们分析价格因素 # 问题看完之后我们开始对数据进行预处理 # 由于星级对我们问题的分析帮助很大所以我们无法用删除或者众数等方式填充因此我们用无来填充将其划分为一个新的类别 data[星级] data[星级].fillna(无) print(data[星级].isnull().sum()) 至于简介和地址缺失数据无关紧要这里我们可以选择用无来填充也可以用删除来处理为了不破坏数据的完整性这里我选择用无来填充 data data.fillna(无) # print(data.isnull().sum()) # 这样我们的数据就没有了缺失值 # print(data.info()) # 1、全国景点分布 我们分析城市的分布即可 scenic data[城市].value_counts().sort_values(ascendingFalse) plt.figure() scenic.plot(kindbar,stackedFalse,colormapviridis,figsize(10,6)) plt.title(各个城市景点数量分布图) plt.xlabel(城市) plt.ylabel(景点个数) # plt.show() # 2、国民出游分析 我们可以分析评分城市销量之间的关系 # data[销量] data[销量].astype(int) 这种转换类型的方法如果有无法转换的值则无法转换 data[评分] pd.to_numeric(data[评分], errorscoerce) data[销量] pd.to_numeric(data[销量],errorscoerce) data[价格] pd.to_numeric(data[价格],errorscoerce)city_sales data.groupby(城市)[销量].sum() city_sales city_sales.sort_values(ascendingFalse)plt.figure() city_sales.plot(kindbar,stackedTrue,colormapplasma,figsize(10,6)) plt.title(各个城市景点门票销量) plt.xlabel(城市) plt.ylabel(销量)# 从销量可以看出北京上海江苏四川陕西广东的销量较高因此我们着重分析这六个地方的景点评分 shanghai data[data[城市].str.contains(上海)] beijing data[data[城市].str.contains(北京)] jiangsu data[data[城市].str.contains(江苏)] sichuan data[data[城市].str.contains(四川)] shanxi data[data[城市].str.contains(陕西)] guangdong data[data[城市].str.contains(广东)]shanghai_group shanghai.groupby(名称)[销量].sum().reset_index() beijing_group beijing.groupby(名称)[销量].sum().reset_index() jiangsu_group jiangsu.groupby(名称)[销量].sum().reset_index() sichuan_group sichuan.groupby(名称)[销量].sum().reset_index() shanxi_group shanxi.groupby(名称)[销量].sum().reset_index() guangdong_group guangdong.groupby(名称)[销量].sum().reset_index()shanghai_sort shanghai_group.merge(shanghai[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) beijing_sort beijing_group.merge(beijing[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) jiangsu_sort jiangsu_group.merge(jiangsu[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) sichuan_sort sichuan_group.merge(sichuan[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) shanxi_sort shanxi_group.merge(shanxi[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10) guangdong_sort guangdong_group.merge(guangdong[[名称,评分]].drop_duplicates(),on名称).sort_values(by销量, ascendingFalse).head(10)shanghai_sort.reset_index(dropTrue,inplaceTrue) beijing_sort.reset_index(dropTrue,inplaceTrue) jiangsu_sort.reset_index(dropTrue,inplaceTrue) sichuan_sort.reset_index(dropTrue,inplaceTrue) shanxi_sort.reset_index(dropTrue,inplaceTrue) guangdong_sort.reset_index(dropTrue,inplaceTrue)plt.figure() plt.bar(shanghai_sort[名称],shanghai_sort[销量]) for i, v in enumerate(shanghai_sort[评分]):plt.text(i, shanghai_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(上海市销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(beijing_sort[名称], beijing_sort[销量]) for i, v in enumerate(beijing_sort[评分]):plt.text(i, beijing_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(北京市销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(jiangsu_sort[名称], jiangsu_sort[销量]) for i, v in enumerate(jiangsu_sort[评分]):plt.text(i, jiangsu_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(江苏省销量排名前十的景点) plt.xticks(rotationvertical)plt.figure() plt.bar(sichuan_sort[名称], sichuan_sort[销量]) for i, v in enumerate(sichuan_sort[评分]):plt.text(i, sichuan_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(四川省销量排名前十的景点) plt.xticks(rotation45)plt.figure() plt.bar(shanxi_sort[名称], shanxi_sort[销量]) for i, v in enumerate(shanxi_sort[评分]):plt.text(i, shanxi_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(陕西省销量排名前十的景点) plt.xticks(rotation45)plt.figure(figsize(10,6)) plt.bar(guangdong_sort[名称], guangdong_sort[销量]) for i, v in enumerate(guangdong_sort[评分]):plt.text(i, guangdong_sort[销量][i] 0.2, str(v), hacenter)plt.xlabel(名称) plt.ylabel(销量) plt.title(广东省销量排名前十的景点) plt.xticks(rotation45) 由此我们结合这几个分析来回答这几个问题
http://www.hkea.cn/news/14295854/

相关文章:

  • 开发一个app软件的公司自己的网站怎么优化
  • 国外设计师灵感网站wordpress阿里云邮箱
  • 网站报价清单网络规划与设计需求分析
  • 兼职做网站在那里接任务网络公司+网站建设+小程序
  • 贵阳网站建设推广焦作市建设银行网站
  • 怎么自己做网站排名网站如何屏蔽ip段
  • 网站建设公司 壹宇网络对网站进行seo优化
  • 笑话网站php程序济南网站建设大标网络
  • 衡阳做网站ss0734聚划算网站建设分析
  • 企业网站建设要注意陕西专业网站开发多少钱
  • zencart 网站入侵免费静态网页
  • iis网站域名访问网站做百度推广
  • 网站开发课题研究背景中国建设银行网站晋阳支行
  • 重庆网站seo排名深圳新恒基建设公司
  • 怎样建立一个自己的网站黑龙江采购网
  • 资阳网站推广电商运营和网站运营对比
  • 手机网站模板 phpxampp 做网站
  • 做网站个人怎么赚钱吗一般的网站开发语言用什么
  • 重庆璧山网站建设小广告治理
  • 网站切图怎么收费网站技术解决
  • 企业做网站好吗小米手机的网站架构
  • 在百度做推广需要网站网站建设竞价托管什么意思
  • dw 做网站图片之间的链接知名高端网站设计企业
  • wordpress 4.5.1 漏洞seo优化就业前景
  • 服装网站建设建议wordpress内存使用
  • 怎么做最简单的网站网络营销策划实务
  • 沧县网站建设公司优购物
  • 快站教程我的世界做披风网站
  • 网站开发seo那种漂亮的网站怎么做
  • 网站建设 成功案例政工网站建设方案