mmmjyjy 2020-07-16
pandas的apply函数是自动根据function遍历每一个数据,然后返回一个数据结构为Series的结果
DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)
参数解释:
1.func:就是函数,不管是自定义的函数,还是匿名函数lambda
2.axis:0是类,1是行,默认axis=0
例子:
import numpy as np import pandas as pd a=np.arange(1,13).reshape(3,4) df=pd.DataFrame(a,columns=list(‘abcd‘)) df.apply(lambda x:x.sum()) df.apply(lambda x:x.sum(),axis=1) #应用于Series数据 df[‘a‘].apply(lambda x:x*x)
计算的时候总共分3步,1到2是第二组......lower: i. 这组数据中的小值 higher: j. 这组数据中的大值,fraction 是第三步中的小数部分,意思是当前这组数据的0到1的分位数
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引