当前位置: 首页 > news >正文

网站开发w亿玛酷1负责wordpress admin

网站开发w亿玛酷1负责,wordpress admin,石家庄市建设网站,中国的wordpressPython NumPy 数据分析#xff1a;处理复杂数据的高效方法 文章目录 Python NumPy 数据分析#xff1a;处理复杂数据的高效方法一 数据来源二 获取指定日期数据三 获取指定行列数据四 求和计算五 比例计算六 平均值和标准差七 完整代码示例八 源码地址 本文详细介绍了如何使用…Python NumPy 数据分析处理复杂数据的高效方法 文章目录 Python NumPy 数据分析处理复杂数据的高效方法一 数据来源二 获取指定日期数据三 获取指定行列数据四 求和计算五 比例计算六 平均值和标准差七 完整代码示例八 源码地址 本文详细介绍了如何使用 Python 和 NumPy 对复杂数据进行高效的数据分析。通过从 Kaggle 获取的公开数据集演示了如何读取 CSV 文件、提取特定日期和字段的数据并进行数据的统计与分析。本文展示了使用 NumPy 进行数据操作的便捷方式如通过索引获取指定行列数据计算累计数值和新增长的总数还讲解了如何计算比率、平均值、标准差等关键统计数据。文章还包括完整的代码示例帮助读者轻松上手进行复杂数据的分析任务。 导入 NumPy import numpy as np一 数据来源 数据来源Kaggle 上的公开数据集 读取数据如下 def get_result():with open(csv/your_data.csv, r, encodingutf-8) as f:data f.readlines()your_data {date: [],data: [],header: [h for h in data[0].strip().split(,)[1:]]}for row in data[1:]:split_row row.strip().split(,)your_data[date].append(split_row[0])your_data[data].append([float(n) for n in split_row[1:]])return your_data数据太多可以先看少部分数据如下 # 获取少数行数据print(your_data[data][:2])print(your_data[date][:5])二 获取指定日期数据 date_idx your_data[date].index(2020-02-03) print(日期-索引转换, date_idx)data np.array(your_data[data])for header, number in zip(your_data[header], data[date_idx]):print(header, :, number)三 获取指定行列数据 # 获取指定行列数据 row_idx your_data[date].index(2020-01-24) # 获取日期索引 column_idx your_data[header].index(Confirmed) # 获取标题的索引 confirmed0124 data[row_idx, column_idx] print(截止 2020-01-24 的累积数, confirmed0124)row_idx your_data[date].index(2020-07-23) # 获取日期索引 column_idx your_data[header].index(New deaths) # 获取标题的索引 result data[row_idx, column_idx] print(截止 2020-07-23 的数, result)四 求和计算 # 总增长数 row1_idx your_data[date].index(2020-01-25) row2_idx your_data[date].index(2020-07-22) new_cases_idx your_data[header].index(New cases)# 注意要 row1_idx 1 得到从 01-25 这一天的新增 # row2_idx 1 来包含 7 月 22 的结果 new_cases data[row1_idx 1: row2_idx 1, new_cases_idx] # print(new_cases) overall new_cases.sum() print(总共, overall)五 比例计算 # 比例计算 new_cases_idx your_data[header].index(New cases) new_recovered_idx your_data[header].index(New recovered)not_zero_mask data[:, new_recovered_idx] ! 0 ratio data[not_zero_mask, new_cases_idx] / data[not_zero_mask, new_recovered_idx]代码中出现 nannan 在 numpy 中表示的是 Not a Number说明计算有问题代码 not_zero_mask data[:, new_recovered_idx] ! 0 避免除数为 0 的情况。 六 平均值和标准差 # 平均值, 标准差 ratio_mean ratio.mean() ratio_std ratio.std() print(平均比例, ratio_mean, 标准差, ratio_std)平均比例 和 标准差计算。 七 完整代码示例 # This is a sample Python script.# Press ⌃R to execute it or replace it with your code. # Press Double ⇧ to search everywhere for classes, files, tool windows, actions, and settings. import numpy as np# 读取数据 def get_result():with open(csv/your_data.csv, r, encodingutf-8) as f:data f.readlines()your_data {date: [],data: [],header: [h for h in data[0].strip().split(,)[1:]]}for row in data[1:]:split_row row.strip().split(,)your_data[date].append(split_row[0])your_data[data].append([float(n) for n in split_row[1:]])return your_datadef print_hi(name):# Use a breakpoint in the code line below to debug your script.print(fHi, {name}) # Press ⌘F8 to toggle the breakpoint.your_data get_result()# 获取少数行数据print(your_data[data][:2])print(your_data[date][:5])# 获取指定日期数据date_idx your_data[date].index(2020-02-03)print(2020-02-03 日期-索引转换, date_idx)data np.array(your_data[data])for header, number in zip(your_data[header], data[date_idx]):print(header, :, number)# 获取指定行列数据row_idx your_data[date].index(2020-01-24) # 获取日期索引column_idx your_data[header].index(Confirmed) # 获取标题的索引confirmed0124 data[row_idx, column_idx]print(截止 2020-01-24 的累积数, confirmed0124)row_idx your_data[date].index(2020-07-23) # 获取日期索引column_idx your_data[header].index(New deaths) # 获取标题的索引result data[row_idx, column_idx]print(截止 2020-07-23 的数, result)# 求和计算row1_idx your_data[date].index(2020-01-25)row2_idx your_data[date].index(2020-07-22)new_cases_idx your_data[header].index(New cases)# 注意要 row1_idx 1 得到从 01-25 这一天的新增# row2_idx 1 来包含 7 月 22 的结果new_cases data[row1_idx 1: row2_idx 1, new_cases_idx]# print(new_cases)overall new_cases.sum()print(总共, overall)# 比例计算new_cases_idx your_data[header].index(New cases)new_recovered_idx your_data[header].index(New recovered)not_zero_mask data[:, new_recovered_idx] ! 0ratio data[not_zero_mask, new_cases_idx] / data[not_zero_mask, new_recovered_idx]# 平均值, 标准差ratio_mean ratio.mean()ratio_std ratio.std()print(平均比例, ratio_mean, 标准差, ratio_std)if __name__ __main__:print_hi(数据分析)# See PyCharm help at https://www.jetbrains.com/help/pycharm/复制粘贴并覆盖到你的 main.py 中运行运行结果如下。 Hi, 数据分析 [[555.0, 17.0, 28.0, 510.0, 0.0, 0.0, 0.0, 3.06, 5.05, 60.71, 6.0], [654.0, 18.0, 30.0, 606.0, 99.0, 1.0, 2.0, 2.75, 4.59, 60.0, 8.0]] [2020-01-22, 2020-01-23, 2020-01-24, 2020-01-25, 2020-01-26] 2020-02-03 日期-索引转换 12 Confirmed : 19887.0 Deaths : 426.0 Recovered : 604.0 Active : 18857.0 New cases : 3100.0 New deaths : 64.0 New recovered : 145.0 Deaths / 100 Cases : 2.14 Recovered / 100 Cases : 3.04 Deaths / 100 Recovered : 70.53 No. of countries : 25.0 截止 2020-01-24 的累积数 941.0 截止 2020-07-23 的数 9966.0 总共 15247309.0 平均比例 7.049556348053241 标准差 19.094025710450307八 源码地址 代码地址 国内看 Gitee 之 numpy/数据分析.py 国外看 GitHub 之 numpy/数据分析.py 引用 莫烦 Python
http://www.hkea.cn/news/14284519/

相关文章:

  • 专做PPP项目网站西安百度快照优化
  • 广告网站做动图怎么做购物网站难做
  • 做汤的网站专业企业app开发制作
  • 南阳seo网站价格顺德网站制作案例信息
  • 珠海找工作哪个网站好怎么找到仿牌外贸出口公司的网站
  • 网站建设用什么框架好wordpress建站阿里云
  • 大型网站建设方案常见问题延吉做网站
  • 我要发布文章到网站上推广 哪些网站最好教育 wordpress模板下载
  • 深圳市哪些公司做网站好行政审批服务中心
  • 机票旅游网站建设下载赶集网招聘最新招聘
  • 济南网站建设推荐q479185700强涵wordpress xmlrpc漏洞
  • 昆明网站制作公司网站制作流程分为哪七步
  • 太原seo快速排名怎么样泉州seo管理
  • 有什么平台可以做网站云商城
  • 优酷专门给马天宇做的网站怎样在手机安装wordpress
  • 站优云seo优化开发助手app下载
  • 一 网站建设管理基本情况目前网站开发怎么兼顾手机
  • wordpress会员制网站wordpress网站主修改
  • 模板网站区别上海高端网站定制
  • 郑州seo招聘网站优化建议怎么写
  • 域名买好后怎么建设网站wordpress系统邮件设置
  • 圣宠宠物网站建设上海贸易公司排名
  • 灰色网站模板wordpress 全宽轮播
  • 护肤网站的功能设计深圳洲聚网站建设
  • 郑州市建设厅网站wordpress 主题大全
  • 成都手机网站开发温州论坛
  • 青岛网页建设网站seo如何做
  • 创新的网站建设龙江外贸“半年报”
  • 哪个行业建设网站的需求多php网站开发软件是什么
  • 建设网站 织梦网站的策划做推广