当前位置: 首页 > news >正文

陕西建设教育网站wordpress主题 怎么安装

陕西建设教育网站,wordpress主题 怎么安装,h5网站建设 案例,站群评估数据 结构方面 需要清理#xff1a;乱数据不需要清理#xff1a;整洁数据 每列是一个变量每行是一个观察值每个单元格是一个值 内容方面 需要清理#xff1a;脏数据 丢失数据重复数据不一致数据无效或错误数据 不需要清理#xff1a;干净数据 # 获取整体信息 df.in…评估数据 结构方面 需要清理乱数据不需要清理整洁数据 每列是一个变量每行是一个观察值每个单元格是一个值 内容方面 需要清理脏数据 丢失数据重复数据不一致数据无效或错误数据 不需要清理干净数据 # 获取整体信息 df.info() # 获取开头/结尾/随机数据来评估 df.head(10) df.tail(10) df.sample(10) # 调整展示上限 pd.set_option(display.max_columns, 150) pd.set_option(display.max_colwidth, 500)# 评估丢失数据 # 返回布尔值组成的Series或DataFrame scores[考试2].isnull() df.isnull() # 获取空缺值数量 scores[考试2].isnull().sum() df.isnull().sum() # 提取丢失数据的行 scores[scores[考试2].isnull()]# 评估重复数据 students[学号].duplicated() students.duplicated(subset[学号,性别])# 评估不一致数据 students[班级].value_counts()# 评估无效/错误数据 # 排序 students[身高].sort_values() students.describe()清洗数据 结构方面更改为整洁数据结构 内容方面 丢失数据 人工填入缺失值不处理缺失值把有缺失值的行删除用例如平均数等填充代替缺失值 重复数据删除不一致数据统一无效数据删除或替换数据类型转换 实际操作 # 重命名索引和列名(原变量不变需要重新赋值或可选参数inplaceTrue df1.rename(index{2_:2, _5:5, 6*:6}) df1.rename(columns{2_:2, _5:5, 6*:6}) df2.rename(index某函数/方法 df2.rename(columnsstr.upper # 大写 # 更多Series相关方法https://pandas.pydata.org/docs/reference/api/pandas.Series.html # 更多DataFrame相关方法https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html# 重设索引 # 将列值作为索引 df3.set_index(Salesperson) # 还原 df3.reset_index()# 对索引和列名重新排序(原变量不变需要重新赋值或可选参数inplaceTrue df4.sort_index()# 对数据进行转置 df1 df1.T # 对列进行拆分 df2[[人口, 面积]] df2[人口密度].str.split(/, expandTrue) df2 df2.drop(人口密度, axis1) # 把不同列合并成一列 df3[姓].str.cat(df3[名], sep-) # 把宽数据转换成长数据列名变成列值 df4 pf.melt(df4, id_vars[不变的列名], var_name列名所在列列名, value_name原列值所在列列名) # 对行进行拆分 df5.explode(课程列表) # 删除行删除列(原变量不变需要重新赋值或可选参数inplaceTrue df6.drop(2) df6.drop([列,lie],axis1)# 对整列缺失值进行填充索引定位 df1[国家] 中国 # 对某个缺失值进行填充 df2.loc[003:004, 销售额] 800 # 自动找到缺失值进行填充 df4[B].fillna(df[B].mean()) df4.fillna(0) df4.fillna({A: 0, B: 10}) # 不同列可指定替换值 # 删除存在缺失值的行(原变量不变需要重新赋值或可选参数inplaceTrue df5.dropna() df5.dropna(subset[工资]) # 控制范围 # 删除重复数据(原变量不变需要重新赋值或可选参数inplaceTrue df6[姓名].drop_duplicates() df6.drop_duplicates(subset[a,b] keeplast) #同时重复保留最后 # 对值进行替换不一致数据(原变量不变需要重新赋值或可选参数inplaceTrue df7.replace([hnu, 湖大], 湖南大学) df7.replace(hnu: 湖南大学) # 对值的类型进行转换 # 分类数据建议转换为category有利于减小内存让Pandas自动选用合适的统计方法或图表类型 s1pd.Series([1,2,3]) s1.astype(category)保存数据(覆盖原始数据 df1.to_csv(cleaned_sales_data.csv) # 读取时会将索引作为第一列需要更改列名并将其重新设置为索引# 写入时忽略索引(索引无关键信息 df1.to_csv(cleaned_sales_data2.csv indexFalse)
http://www.hkea.cn/news/14433358/

相关文章:

  • 电子商务网站建设需要哪些步骤寓意好兆头的公司名字
  • 加强网站建设 统计局网站内页权重查询
  • 地推app推广赚佣金seo网络推广师招聘
  • 建设个网站要多少钱婚庆网站策划
  • 网站导航菜单设计网站制作实例
  • 南昌建筑行业网站开发深圳商标注册公司
  • 给缅甸公司网站做维护工作时间段没广告的视频播放器app
  • 高级建站网站网站建设首选唯美谷
  • 图列说明网站开发的流程wordpress4.5.3漏洞
  • 忻州建设厅官方网站阿里云域名拍卖
  • 贵阳网站开发公司网站托管服务适用于
  • 大连网站关键词推广衡阳网站网站建设
  • 昆明响应式网站网站建设突出特色
  • 百度怎么进入官方网站郴州市地图全图
  • 更改网站备案负责人wap建站教程
  • 移动网站 图片优化免费网站推广入口
  • 网站如何做聚合页面贵州省住房和城乡建设厅网站官网
  • 公司建网站需要多少钱网页制作素材按钮
  • 局域网网站怎样做数据库什么是静态网站
  • 有关建筑的网站工业软件开发技术就业前景
  • 网站开发 哪个工具更快石景山周边网站建设
  • 合肥网站建设培训jsp网站开发需要哪些技术
  • 青岛网站建设多少钱买了云服务器怎么做网站
  • 沁县网站建设最新网站域名
  • 如何做网站美工关键词全网搜索指数
  • 广州 互联网公司 网站首页正规做网站
  • 怎么样购买服务器建设网站建立电影网站教程
  • 郴州建设局门户网站河南建设监理协会网站
  • 南山区做网站公司网站建设应该计入什么费用
  • 石家庄网页网站制作素材图库