jzlixiao 2020-05-04
import pandas as pd # 两个数据类型:Series = 索引+一维数据、DataFrame = 行列索引+二维数据 Series类型:一组数据及与之相关的数据索引组成 # pd.Series(values, index=[]) # index自定义索引 DataFrame类型:表格型的数据类型,由共用相同索引的一组列组成 既有行索引,也有列索引 # pd.DataFrame(values, index=[], columns=[]) 重新索引 # reindex()能够改变或重排Series和DataFrame的索引 删除索引 # drop()能够删除Series和DataFrame的指定行或列的索引 数据排序方法: # 根据索引排序 sort_index(axis=0, ascending=True) # 根据数值排序 sort_values(axis=0, ascending=True) sort_values(by, axis=0, ascending=True) # by: axis轴上的某个索引或索引列表
计算的时候总共分3步,1到2是第二组......lower: i. 这组数据中的小值 higher: j. 这组数据中的大值,fraction 是第三步中的小数部分,意思是当前这组数据的0到1的分位数
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引