奇趣统计网站谁做的,免费网站空间免费主机,公司网站建设的费用,灰大设计导航目录 1.Pandas简介
2.Series的创建
1.通过数组列表来创建
2.通过传入标量创建
3.通过字典类型来创建 4.通过numpy来创建
3.Series的索引和应用
1. 通过index和values信息
2. 通过切片方法获取信息
4.DataFrame的创建
1.直接创建
2.矩阵方式创建
3.字典类型创建
5.…目录 1.Pandas简介
2.Series的创建
1.通过数组列表来创建
2.通过传入标量创建
3.通过字典类型来创建 4.通过numpy来创建
3.Series的索引和应用
1. 通过index和values信息
2. 通过切片方法获取信息
4.DataFrame的创建
1.直接创建
2.矩阵方式创建
3.字典类型创建
5.DataFrame的索引和应用
1.DataFrame的索引信息提取
2.DataFrame的数据选择
3.索引器操作实例 1.Pandas简介
#Pandas简介PandasPanel data analysis是一个强大的分析结构化数据的工具集
使Python成为高效的数据分析环境。
1.Pandas的基础是NumPy提供高性能的矩阵运算
2.Pandas可用于数据挖掘和数据分析同时也提供数据清洗功能
3.Pandas提供Series、DataFrame等数据结构DataFrames:二维数据整个表格多行多列
Series:一维数据一行或者一列2.Series的创建
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
list1[4,3,-3,10]
1.通过数组列表来创建
#Series的创建
a_serpd.Series(list1)
a_ser#一列是索引一列是数值
2.通过传入标量创建
#传入标量
spd.Series(22)
spd.Series(22,[a,b,c])
s
3.通过字典类型来创建
#通过字典来创建Series
a_dic{a:92,b:45,c:33}
apd.Series(a_dic)
a
%%
#传入字典并且自定义索引
apd.Series({A:90,B:90,C:90},index[B,C,D])
a 4.通过numpy来创建
#通过ndarray
bpd.Series(np.arange(10,15),indexnp.arange(20,25))
b
3.Series的索引和应用
1. 通过index和values信息
%%
#通过index和values获取所引和
print(b.index)
print(b.values)
%%
#index对象
bpd.Series([A,B,C])
b
%%
b.index
%%
b.values
2. 通过切片方法获取信息
%%
a[1:3]
%%
#统计方面的用法
a.mean()
%%
#in函数的用法
#表示如果在Series中返回True,否则返回False
bdict(a)
b
%%
a in a
v in a
b in a
4.DataFrame的创建
1.直接创建
# Dataframe building
# axis0 axis1
gnp.random.randint(60,100,(4,2))
g_dfpd.DataFrame(g,index[Mary,Bob,Lee,Rose],columns[math,chinese])
g_df
2.矩阵方式创建
# dataframe -- ndarray()
a_dfpd.DataFrame(np.random.rand(3,4),index[A,B,C])
a_df
3.字典类型创建
g_dic{math:[96,92,89,90],chinese:[90,21,89,79]}
bpd.DataFrame(g_dic,index[Mary,Bob,Lee,Rose])
b
5.DataFrame的索引和应用
1.DataFrame的索引信息提取
# dataframe -- ndarray()
a_dfpd.DataFrame(np.random.rand(3,4),columns[x,y,z,v],index[one,two,three])
a_df%%
# basical actions for DataFrame functions
a_df.index%%
a_df.columns#列
%%
a_df.values#值
%%
a_df[x]#x列的信息
%%
a_df.T#dateframe转置
%%
a_df[:2]#切片
%%
a_df[[x,v]]#多个切片2.DataFrame的数据选择
# DataFrame的数据选择对DataFrame的数据进行更灵活的选择Pandas提供索引器indexer属性作为取值方法.
1.使用索引器iloc、loc提供灵活的索引形式.
2.可使用loc自定义索引或iloc自动索引以NumPy风格的语法从DataFrame中选取行和列数据
3.通过loc和iloc行、列数据都可以做切片和花式索引.%%
a_df
%%
a_df.loc[[one,two]]#提取前两行
%%
#同时也可以用切片索引
a_df.loc[:,[x,y,z]]
#当然也能够提取一部分3.索引器操作实例
#索引器操作实例
s_dic{Python:[60,99,81,66],C:[63,69,96,84],Java:[63,79,83,84]}
scorepd.DataFrame(s_dic,index[Ann,Bob,Cindy,Lee])
score
%%
#选择单行或者指定行
score.iloc[[0,2],[0,1]]#numpy的匹配对象(0,0)(2,1)
%%
#.loc
score.loc[Ann:Cindy]
%%
#.iloc
score.iloc[0:2]
%%
#loc和iloc都可以修改数据
score.loc[Ann,C]100
score.iloc[2,2]99
score