pandas_查看数据特征和统计信息

knowmore0 2020-05-07

# 查看数据特征和统计信息
import pandas as pd
# 读取文件
dataframe = pd.read_excel(r‘C:\Users\lenovo\Desktop\总结\Python\超市营业额.xlsx‘)

# 查看所有的交易额信息
dataframe[‘交易额‘].describe()
‘‘‘
count      17.000000
mean     1024.117647
std       428.019550
min       580.000000
25%       700.000000
50%       850.000000
75%      1300.000000
max      2000.000000
Name: 交易额, dtype: float64
‘‘‘
# 查看四分位数
dataframe[‘交易额‘].quantile([0,0.25,0.5,0.75,1.0])
‘‘‘
0.00     580.0
0.25     700.0
0.50     850.0
0.75    1300.0
1.00    2000.0
Name: 交易额, dtype: float64
‘‘‘
# 交易额中值
dataframe[‘交易额‘].median()
# 850.0

# 交易额最小的三个数据
dataframe[‘交易额‘].nsmallest(3)
‘‘‘
12    580
4     600
7     600
Name: 交易额, dtype: int64
‘‘‘
dataframe.nsmallest(3,‘交易额‘)
‘‘‘
      工号  姓名        日期           时段  交易额    柜台
12  1005  周七  20190302   9:00-14:00  580   日用品
4   1005  周七  20190301   9:00-14:00  600   日用品
7   1001  张三  20190302  14:00-21:00  600  蔬菜水果
‘‘‘
# 交易额最大的两个数据
dataframe[‘交易额‘].nlargest(2)
‘‘‘
0    2000
1    1800
Name: 交易额, dtype: int64
‘‘‘
# 查看最大的交易额数据
dataframe.nlargest(2,‘交易额‘)
‘‘‘
     工号  姓名        日期           时段   交易额   柜台
0  1001  张三  20190301   9:00-14:00  2000  化妆品
1  1002  李四  20190301  14:00-21:00  1800  化妆品
‘‘‘
# 查看最后一个日期
dataframe[‘日期‘].max()
# 20190303

# 查看最小的工号
dataframe[‘工号‘].min()
# 1001

# 第一个最小交易额的行下标
index = dataframe[‘交易额‘].idxmin()
# 0

# 第一个最小交易额
dataframe.loc[index,‘交易额‘]
# 580

# 最大交易额的行下标
index = dataframe[‘交易额‘].idxmax()
dataframe.loc[index,‘交易额‘]
# 2000

2020-05-07

相关推荐