CatherineC00 2018-07-10
进行已经矢量化后的字符串数据,可以使用pandas的Series数据对象的map方法。这样,对于未经矢量化的数据也可以先进行数据的矢量化转换然后再进行相应的处理。
举例实现字符串数据的操作,编写代码如下:
#!/usr/bin/python import numpy as np import pandas as pd from pandas import Series,DataFrame seriers_data = Series(['Hello','Python','Data','World']) print(seriers_data.map(str.lower))
程序的运行结果如下:
GreydeMac-mini:chapter07 greyzhang$ vim series_map.py GreydeMac-mini:chapter07 greyzhang$ python series_map.py 0 hello 1 python 2 data 3 world dtype: object
上面的例子中,先对列表形式的数据进行了向量化的处理,讲数据处理成pandas的Series对象类型,然后进行矢量化的操作。通过Series的map方法对每个字符串进行了全都转换成小写字母的操作。
计算的时候总共分3步,1到2是第二组......lower: i. 这组数据中的小值 higher: j. 这组数据中的大值,fraction 是第三步中的小数部分,意思是当前这组数据的0到1的分位数
Series是一种类似于一维数组的对象,由一组数据以及一组与之对应的索引组成。 index: 索引序列,必须是唯一的,且与数据的长度相同. 如果没有传入索引参数,则默认会自动创建一个从0~N的整数索引