宿舍 2020-07-18
直接进入主题:
序列是将元素按照顺序排列,通过索引(下标)访问;
字符串、列表、元组都属于序列。
上图:
序列中的每个元素按顺序排列,使用索引进行访问,索引分为正负索引;
举一个栗子,字符串:msg =‘helloworld‘,在jupyter下操作如下:
msg = ‘helloworld‘ #获取第一个元素 print(msg[0]) #获取最后一个? print(msg[-1]) #获取第3个元素 print(msg[2]) #获取第12个元素 print(msg[11])
输出结果:
h d l --------------------------------------------------------------------------- IndexError Traceback (most recent call last) <ipython-input-6-589026671881> in <module>() 7 print(msg[2]) 8 #获取第12个元素 ----> 9 print(msg[11]) IndexError: string index out of range
诶呀我去,怎么出了这么个玩意?一般大家看到这种错误,莫名的头疼,这时候我们会问:
序列的索引从0开始,
第1个元素对应索引为0,
第2个索引就是1,以此类推,第N个元素对应的索引就是N-1;
Python中出错后,会报出行号,错误信息,这些信息可以让我们定位问题,例如:
错误类型:索引越界,需要检查访问索引值;
因为索引值大于序列长度,造成访问的元素不存在。
如果你想,这种方式也是可以的;
但是我们一般使用for循环,代码如下:
print(msg) #for 遍历序列,依次去msg中的每个元素, #并赋值给val for val in msg: print(val)
for 循环内部做了异常处理,所以不会出错,我们直接使用就可以。
切片是Python中的操作符,类似函数操作,使用方式如下:
使用方式:sequence[start:stop];
参数:start为起始索引,stop为结束索引,
结果:获取索引start到stop-1元素,返回新的序列;
默认值:start默认0,stop默认到序列最后一个元素;sequence[start:stop:step]:与上类似,step为步进值,默认为1;
上刚出锅的栗子,msg = ‘hellowolrd‘,操作如下:
msg = ‘helloworld‘ #索引从0开始算 #获取索引2到4之间元素? print(msg[2:5]) #stop -1 #获取索引0到7之间元素? print(msg[0:8]) #获取索引5之后所有元素? print(msg[5:11]) #stop -1 print(msg[5:]) #默认到最后 print(msg[5:100])#会不会报错,为什么?
输出结果:
llo hellowor world world world
没有高不高级,看如何使用;
同样一块面,你做成馒头他就2元,你做成蛋糕他就有一万种可能。
理解知识点:序列有两种索引:正索引,负索引;
切片操作三个值:start,stop,step,step为步进值,可以为负数;
来几个小操作,想表现自己的可以把答案写在品论区,再继续阅读:
1>索引倒数第2个之后所有元素,
2>索引从0到结束,隔一个取一个,
3>索引倒数第二个开始,向前隔一个取一个元素,
4>切片操作实现倒序,
到这里,想要测试自己的,可以尝试练习了;
具体实现如下:
msg = ‘helloworld‘ #获取索引倒数第二个元素之后所有元素 print(msg[-2:]) #获取索引从0到结束,隔一个取一个元素 #理解为,start为0,stop到最后,step为2的切片操作 print(msg[::2]) #倒数第二个开始,向前隔一个取一个元素 #理解为:start为-2,stop到最前,step为-2的切片操作 print(msg[-2::-2]) #切片操作实现倒序? print(msg[::-1])
输出结果:
ld hlool loolh dlrowolleh
这些搞定了,我们就基本掌握切片操作了。
运算符 | 是否支持 |
---|---|
算数运算符 | 支持加法与乘法操作,返回新的序列 |
比较运算符 | 支持,返回True与False |
逻辑运算符 | 支持 |
注意:必须是同种类型数据结构操作才有意义。
直接使用加法操作,如下:
wd1 = ‘hello‘ wd2 = ‘world‘ print(wd1 + wd2) print(wd1 * 2)
输出结果:
helloworld hellohello
使用len方法:
msg = ‘helloworld‘ print(len(msg))
输出结果:10
能,使用range方法,生成索引,然后使用for循环遍历:
msg = ‘helloworld‘ #获取长度,生成range对象 #使用for遍历range获取索引 #通过索引访问元素 for index in range(len(msg)): print(msg[index])
需要使用enumerate:enumerate(iterable[, start])
参数:iterable:可迭代对象,start:可选参数,指定起始位置;
返回:索引与value对应的enumerate对象;
可以使用for循环进行遍历,具体使用如下:
msg = ‘helloworld‘ #创建enumerate对象 items = enumerate(msg) #遍历enumerate对象 for item in items: print(item)
输出结果:
(0, ‘h‘) (1, ‘e‘) (2, ‘l‘) (3, ‘l‘) (4, ‘o‘) (5, ‘w‘) (6, ‘o‘) (7, ‘r‘) (8, ‘l‘) (9, ‘d‘)
是否还记得多元赋值:x,y = 1,2
第一种方式:
msg = ‘helloworld‘ for item in enumerate(msg): index, value = item print(index, value)
第二种方式:
msg = ‘helloworld‘ for tindex, tvalue in enumerate(msg): print(tindex, tvalue)
第一种容易理解,第二种怎么回事?
for循环迭代的时候,首先从 enumerate取元素,而 enumerate的每个元素都是(index, values),我们这里加了两个变量tindex, tvalue去接受值,相当于多元赋值。
使用操作符:in与not in
in:元素是否在序列中,在返回True,否则返回False,例如:‘a‘ in ‘abc‘;
not in:与in相反;
实际操作如下:
#加法与乘法: msg = ‘helloworld*‘ #元素是否在序列中 print(‘w in msg:‘, ‘w‘ in msg) print(‘a in msg:‘, ‘a‘ in msg) print(‘a not in msg:‘,‘a‘ not in msg)
输出结果:
w in msg: True a in msg: False a not in msg: True
好了以上就是序列相关的问题与讲解,这么好的文章,收藏点赞关注在走吧,不然下次就找不到了。
另外一部分,则需要先做聚类、分类处理,将聚合出的分类结果存入ES集群的聚类索引中。数据处理层的聚合结果存入ES中的指定索引,同时将每个聚合主题相关的数据存入每个document下面的某个field下。