当前位置: 首页 > news >正文

建立网站一般经历的阶段红酒网站建设方案

建立网站一般经历的阶段,红酒网站建设方案,网站开发小结,免费照片的网站模板免费下载在本文中#xff0c;我将分享4个在一行代码中完成的Pandas操作。这些操作可以有效地解决特定的任务#xff0c;并以一种好的方式给出结果。 从列表中创建字典 我有一份商品清单#xff0c;我想看看它们的分布情况。更具体地说#xff1a;希望得到唯一值以及它们在列表中出…在本文中我将分享4个在一行代码中完成的Pandas操作。这些操作可以有效地解决特定的任务并以一种好的方式给出结果。 从列表中创建字典 我有一份商品清单我想看看它们的分布情况。更具体地说希望得到唯一值以及它们在列表中出现的次数。 Python字典是以这种格式存储数据的好方法。键将是字典值是出现的次数。 这里可以使用value_counts和to_dict函数这项任务可以在一行代码中完成。 这里有一个简单的例子来说明这种情况: importpandasaspdgrades [A, A, B, B, A, C, A, B, C, A]pd.Series(grades).value_counts().to_dict()# output{A: 5, B: 3, C: 2}将列表转换为Pandas Series这是Pandas的一维数据结构然后应用value_counts函数来获得在Series中出现频率的唯一值最后将输出转换为字典。这个操作非常高效且易于理解。 从JSON文件创建DataFrame JSON是一种常用的存储和传递数据的文件格式。 当我们清理、处理或分析数据时我们通常更喜欢使用表格格式(或类似表格的数据)。由于json_normalize函数我们可以通过一个操作从json格式的对象创建Pandas DataFrame。 假设数据存储在一个名为data的JSON文件中。一般情况我们都是这样读取: importjsonwithopen(data.json) asf:datajson.load(f)data# output{data: [{id: 101,category: {level_1: code design, level_2: method design},priority: 9},{id: 102,category: {level_1: error handling, level_2: exception logging},priority: 8}]}如果我们将这个变量传递给DataFrame构造函数它将创建如下的DataFrame这绝对不是一个可用的格式: dfpd.DataFrame(data)但是如果我们使用json_normalize函数将得到一个整洁的DataFrame格式: dfpd.json_normalize(data, data)Explode函数 如果有一个与特定记录匹配的项列表。需要重新格式化它为该列表中的每个项目提供单独的行。 这是一个经典的行分割成列的问题。有许多的不同的方法来解决这个任务。其中最简单的一个(可能是最简单的)是Explode函数。 我们以这个df为例 使用explosion函数并指定列名: df_newdf.explode(columndata).reset_index(dropTrue)reset_index会为DataFrame分配一个新的整数索引。 combine_first函数 combine_first函数用于合并两个具有相同索引的数据结构。 它最主要的用途是用一个对象的非缺失值填充另一个对象的缺失值。这个函数通常在处理缺失数据时很有用。在这方面它的作用与SQL中的COALESCE函数相同。 dfpd.DataFrame({A: [None, 0, 12, 5, None], B: [3, 4, 1, None, 11]})我们需要a列中的数据。如果有一行缺少值(即NaN)用B列中同一行的值填充它。 df[A].combine_first(df[B])# output0 3.01 0.02 12.03 5.04 11.0Name: A, dtype: float64可以看到的列A的第一行和最后一行取自列B。 如果我们想要使用3列我们可以链接combine_first函数。下面的代码行首先检查列a。如果有一个缺失的值它从列B中获取它。如果列B中对应的行也是NaN那么它从列C中获取值。 df[A].combine_first(df[B]).combine_first(df[C])我们还可以在DataFrame级别使用combine_first函数。在这种情况下所有缺失的值都从第二个DataFrame的相应值(即同一行同列)中填充。 df1pd.DataFrame({A: [1, 2, np.nan, 4], B: [5, np.nan, 7, 8]}, index[a, b, c, d])df2pd.DataFrame({A: [10, np.nan, 30, 40], B: [50, 60, np.nan, 80]}, index[a, b, c, d])result_dfdf1.combine_first(df2)在合并的过程中 df1中的非缺失值填充了 df2中对应位置的缺失值。这有助于处理两个数据集合并时的缺失值情况。 MergedDataFrame:A Ba 1.0 5.0b 2.0 60.0c 30.0 7.0d 4.0 8.0总结 从计算简单的统计数据到高度复杂的数据清理过程Pandas都可以快速解决任务。上面的代码可能不会经常使用但是当你需要处理这种任务时它们是非常好的解决办法。 https://avoid.overfit.cn/post/1e70db7ef5534ff0801316609a1499b1 作者Soner Yıldırım
http://www.hkea.cn/news/14590484/

相关文章:

  • 网站建设与维护考题wordpress没有分类目录
  • 门户网站设计做网站开票内容是什么
  • 广州怎么建设一个网站咨询公司需要什么条件
  • 信息网站建设方案网站内容更新方案
  • 网站在排版有哪些方法做的网站图片不显示
  • pc网站 手机网站 微网站建站网站推荐
  • 上海注册公司在哪个网站wordpress积分站内搜索
  • 娄底网站推广营销策划公司名称大全
  • 做物流的网站有哪些功能搭wordpress用什么
  • 深圳手机移动网站开发单位宣传册设计样本
  • 文件备案网站建设方案新手网页制作
  • 大庆加油app老版本无锡优化网站排名
  • 个人网站注册平台钱滁州商业网站建设
  • 邀约网站怎么做请柬深圳十大广告公司
  • 江苏新宁建设集团网站泰安新浪乐居房产网
  • 电子商务网站首页做品牌网站的
  • 用html怎么做网站尾部wordpress文本组件使用方法
  • gif网站素材专业微信网站建设多少钱
  • 国内食品行业网站开发wordpress图片缩放
  • 自己做的网站上出现乱码怎么修改商城微发布官网
  • 在重庆_那里可以做诚信网站认证广播电台网站建设方案
  • 阿里云主机做网站学会建网站如何做网络营销
  • 贵州 跨境电商网站建设赵县住房和城乡建设局网站首页
  • 南京 推广 网站建设为什么这么多人嫌弃top域名
  • 网站维护合同范本wordpress 分类信息主题
  • 加强本单位政务网站建设电商推广渠道有哪些
  • 怎么使用域名访问网站施工企业会计科目
  • 网站改版业务创意设计ppt
  • 广州 环保 凡人网站建设旅游网站建设成本核算
  • 创网站需要什么清远做网站哪家好