pandas——DataFrame 阳光穿透心脏的1/2处 2021-11-27 05:04 444阅读 0赞 Series 一维数据,带标签的数组 DataFrame 二维数据,Series容器 **DataFrame** import pandas as pd import numpy as np t = pd.DataFrame(np.arange(12).reshape(3,4)) print(t) """ 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 """ 二维情况下 行索引 index 0轴 axis = 0 列索引 columns 1轴 axis = 1 import pandas as pd import numpy as np t = pd.DataFrame(np.arange(12).reshape(3,4),index=list("xyz"),columns=list("abcd")) print(t) 通过字典创建DataFrame 会怎么样? import pandas as pd tmp_dict = { "name":["xiaoma","xiaoming"], "age":[47,28], "tel":["10086","10010"] } t = pd.DataFrame(tmp_dict) print(t) print(type(t)) """ 行索引:0,1,2,3.... 列索引 字典的键 """ tmp2 = [ { "name":"XX","age":22,"tel":"10086"}, { "name":"PP","age":47}, { "name":"TT","tel":"10086"}, ] t2 = pd.DataFrame(tmp2) print(t2) """ name age tel 0 XX 22.0 10086 1 PP 47.0 NaN 2 TT NaN 10086 没有的值,会变成NaN """ t.index #行索引 t.columns #列索引 t.values #数值 t.shape #形状 t.dtypes #每列的类型 t.ndim #数据的维度 t.head(3) #显示数据的前3行,默认5 t.tail(2) #显示末尾的2行,默认5 t.info() #相关信息概览,行数 列数 列索引 列非空值个数 列类型 内存占用 t.describe() #快速统计数值列的情况,计数 均值 标准差 最大值 四分位数 最小值 # 排序 df.soft_values( by="Count_AnimalName", ascending=False ) # ascending=False 降序 # ascending=True 升序 # DataFrame索引 df[数 字] # 表示行索引 df[字符串] # 表示列索引 df[:100]["Count_AnimalName"] # 先取前100行,再取列 pandas loc #获取a行z列 t.loc["a","Z"] # 获取a行 t.loc["a"] t.loc["a",:] # 取列 t.loc[:,"Z"] # 取多行 t.loc[["a","c"],:] # 获取a到c行,W和Z列的数据 t.loc["a":"c",["W","Z"]] t.iloc 同 t.loc 不过传入的是数字索引 布尔索引 df[df["age"]>50] df[(df["age"]>50)&(df["age"]<80] """ & 且 | 或 df["name"].str.len() <4 """ 处理NaN https://blog.csdn.net/Tyro_java/article/details/81396000 0\] df\[(df\[“age”\]>50)&(df\[“age”\]<80\] “”" & 且 | 或 df\[“name”\].str.len() <4 “”" 处理NaN [https://blog.csdn.net/Tyro\_java/article/details/81396000][https_blog.csdn.net_Tyro_java_article_details_81396000] [https_blog.csdn.net_Tyro_java_article_details_81396000]: https://blog.csdn.net/Tyro_java/article/details/81396000
还没有评论,来说两句吧...