knowmore0 2020-05-07
# 查看数据特征和统计信息 import pandas as pd # 读取文件 dataframe = pd.read_excel(r‘C:\Users\lenovo\Desktop\总结\Python\超市营业额.xlsx‘) # 查看所有的交易额信息 dataframe[‘交易额‘].describe() ‘‘‘ count 17.000000 mean 1024.117647 std 428.019550 min 580.000000 25% 700.000000 50% 850.000000 75% 1300.000000 max 2000.000000 Name: 交易额, dtype: float64 ‘‘‘ # 查看四分位数 dataframe[‘交易额‘].quantile([0,0.25,0.5,0.75,1.0]) ‘‘‘ 0.00 580.0 0.25 700.0 0.50 850.0 0.75 1300.0 1.00 2000.0 Name: 交易额, dtype: float64 ‘‘‘ # 交易额中值 dataframe[‘交易额‘].median() # 850.0 # 交易额最小的三个数据 dataframe[‘交易额‘].nsmallest(3) ‘‘‘ 12 580 4 600 7 600 Name: 交易额, dtype: int64 ‘‘‘ dataframe.nsmallest(3,‘交易额‘) ‘‘‘ 工号 姓名 日期 时段 交易额 柜台 12 1005 周七 20190302 9:00-14:00 580 日用品 4 1005 周七 20190301 9:00-14:00 600 日用品 7 1001 张三 20190302 14:00-21:00 600 蔬菜水果 ‘‘‘ # 交易额最大的两个数据 dataframe[‘交易额‘].nlargest(2) ‘‘‘ 0 2000 1 1800 Name: 交易额, dtype: int64 ‘‘‘ # 查看最大的交易额数据 dataframe.nlargest(2,‘交易额‘) ‘‘‘ 工号 姓名 日期 时段 交易额 柜台 0 1001 张三 20190301 9:00-14:00 2000 化妆品 1 1002 李四 20190301 14:00-21:00 1800 化妆品 ‘‘‘ # 查看最后一个日期 dataframe[‘日期‘].max() # 20190303 # 查看最小的工号 dataframe[‘工号‘].min() # 1001 # 第一个最小交易额的行下标 index = dataframe[‘交易额‘].idxmin() # 0 # 第一个最小交易额 dataframe.loc[index,‘交易额‘] # 580 # 最大交易额的行下标 index = dataframe[‘交易额‘].idxmax() dataframe.loc[index,‘交易额‘] # 2000
2020-05-07
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引