python第六周：字典，jieba库

HongKongPython 2020-01-10

字典：

字典类型是“映射”的体现

键值对：键是数据索引的扩展

字典是键值对的集合，键值对之间无序，采用大括号{}和dict（）创建，键值对用冒号。表示为

{<键1>:<值1>,<键2>:<值2>, ... , <键n>:<值n>}

在字典变量中，通过键值获取值，如： <值> = <字典变量>[<键>]

>>> d = {"中国":"北京","美国":"华盛顿":"法国":"巴黎"}
>>> d["中国"] 
"北京"
>>> de = {} ; type(de)
<class ‘dict‘>#返回变量x的类型

字典类型操作函数和方法

del d[k]	删除字典d中键k对应的数据值
k in d	判断键k是否在字典d中，如果在返回True，否则返回false
d.keys()	返回字典d中所有键信息
d.values()	返回字典d中所有值的信息
d.items()	返回字典d中所有的键值对信息

d.get(k,<default>)	键k存在，返回相应值，不在则返回<default>值
d.pop(k,<default>)	键k存在，则取出相应值，不在则返回<default>值
d.popitem()	随机从字典d中取出一个键值对，以元组形式返回
d.clear()	删除所有键值对
len(d)	返回字典d中元素的个数

jieba库是优秀的中午分词第三方库

cmd命令： pip install jieba

原理：利用了一个中文词库，确定汉字之间的关联概率

精确模式：把文本精确的分开，不存在冗余单词

全模式：把文本所有可能的词语扫描出来，有冗余

搜索引擎模式：在精确模式的基础上，对长词再次切分

常用函数

jieba.lcut(s)	精确模式，返回一个列表类型的分词结果
jieba/lcut(s,cut_all=Ture)	全模式
jieba.lcut_for_search(s)	搜索引擎模式
jieba.add_word(w)	向分词词典增加新词w

: HongKongPython

相关推荐

python中strip(),lstrip(),rstrip()函数的使用讲解

（意思就是你想去掉字符串里面的哪些字符，那么你就把这些字符当参数传入。）如果strip()的参数为空，那么会默认删除字符串头和尾的空白字符。#这里注意字符串a的两端都有一个空白字符，字符a和n之间也有一个。这两个函数和上面的strip()基本是一样的，参数

世事一场大梦 0喜欢 / 0评论 2020-11-17

Python爬虫破解登陆哔哩哔哩的方法

作为一名找不到工作的爬虫菜鸡人士来说，登陆这一块肯定是个比较大的难题。从今天开始准备一点点对大型网站进行逐个登陆破解。加深自己爬虫水平。if response_json['code'] == 0 and response_json['data']['sta

夜斗不是神 0喜欢 / 0评论 2020-11-17

Python list和str互转的实现示例

输出： [1, 2, 3, 4, 5]. list2 = str2.split() #or list2 = str2.split(" "). 以下几个内置的函数可以执行数据类型之间的转换。这些函数返回一个新的对象，表示转换的值。将x转换

xiaoseyihe 0喜欢 / 0评论 2020-11-16

致命错误！Python开发者的7个崩溃瞬间

本文转载自公众号“读芯术”。毫无疑问，Python是当今使用最为广泛的编程语言。但无论你经验多丰富，或是已使用过多少种语言，切换到Python时都不能保证非常顺利。具有面向对象编程背景的开发人员容易忽略Python的惯用特性，很可能会滥用编程结构，从而产生

huavhuahua 0喜欢 / 5评论 2020-11-20

Python五个隐藏的特性，你可能从未听说过

在本文中，我将向您展示Python中很常见的5个特性。有经验的Python开发人员可能认识其中一些。然而，这对其他人仍将是未知的。是的，你没看错，在Python中...是一个有效的构造。...是称为省略号的单例对象。如果你把它输入到Python解释器中，你

Yasin 0喜欢 / 15评论 2020-11-16

为什么继承 Python 内置类型会出问题？！

《流畅的Python》一书值得反复回看，可以温故知新。最近我偶然翻到书中一个有点诡异的知识点，因此准备来聊一聊这个话题——子类化内置类型可能会出问题?!在正式开始之前，我们首先要科普一下：哪些是 Python 的内置类型?这些类型可以简单理解成其它语言中的

xiaoseyihe 0喜欢 / 12评论 2020-11-16

使用开源可视化工具来理解你的Python代码

VizTracer 工具可以可视化并跟踪 Python 代码，让你可以更深入地了解其工作原理。随着 Python 项目变得越来越大、越复杂，理解起它来就变得充满挑战性。即使是你自己独自编写了整个项目，也不可能完全知道项目是如何工作的。为了能更好的理解你的代

千锋 0喜欢 / 12评论 2020-11-15

Python代码可以有多简洁，看看它如何实现数组求极值

Python 最大的优势是不需编译，而且代码简洁。我初学 Python 时，被它的简洁震惊到了，尤其是文件操作和数组操作，只需要一行代码搞定文件读入，相同功能， Java 的 IO 操作基本上是十行代码量。所以，偶尔也会用 Python 做一些小事情。

diyanpython 0喜欢 / 12评论 2020-11-12

深入Python中引用计数

在python中的垃圾回收机制主要是以引用计数为主要手段以标记清除和隔代回收机制为辅的手段。可以对内存中无效数据的自动管理!在这篇文章，带着这个问题来一直往下看：怎么知道一个对象能不能被调用了呢?Python中的任何变量都有对应的内存引用，也就是内存地

chunjiekid 0喜欢 / 12评论 2020-11-10

Python文本预处理，试试BAT大佬总结的实用代码！

本文将讨论文本预处理的基本步骤，旨在将文本信息从人类语言转换为机器可读格式以便用于后续处理。此外，本文还将进一步讨论文本预处理过程所需要的工具。当拿到一个文本后，首先从文本正则化处理开始。如果文本中的数字与文本分析无关的话，那就删除这些数字。通常，正则化

wordmhg 0喜欢 / 0评论 2020-11-06

使出Python的六脉神剑，让Python拥有无限扩展性

我们知道，Python的API非常多，功能非常强大，而且非常易用。Python之所以强大，一个重要原因是因为Python非常容易与其他编程语言交互。这就让Python拥有了无限扩展性。就算Python无法实现某个功能，可以用其他语言实现，然后Python直

Morelia 0喜欢 / 0评论 2020-11-03

人生苦短，我要换Go！

在使用健壮的软件开发编程语言方面，Golang 已经被许多人选中。这种编程语言为程序员提供了独特的好处。Go 基本上是一个编译语言，它的灵感来自C。所以，如果你精通 C 的语法，你会发现 Golang 是有用的。学习这种编程语言只需要几天时间，因为Go的

CloudXli 0喜欢 / 0评论 2020-11-03

请停止在Python中无休止使用列表

当你学习不熟悉的新东西的时候，一旦发现某样东西有效，那么你就会坚持使用它而放弃探索更多的可能性。在Python中，那样东西就是列表。使用列表的感觉就像是在一直重复你最喜欢的特别动作。然后Python不止列表，还有元组和集合。让我们回顾一下这些特殊的数据类型

文山羊 0喜欢 / 14评论 2020-10-31

Python数据可视化，seaborn如何做出非常规图表

上一节我们只是单纯使用 matplotlib 制作出以下图表：。最常见的就是使用 seaborn ，他是基于 matplotlib 的包装。这一节我们就来看看，如何使用 seaborn 生成标准图表，然后结合 matplotlib 做出定制效果。特别是多系

comtop0 0喜欢 / 14评论 2020-10-31

说一说Python中的几个基础语法

学一门语言，基础语法一定要扎实。就如盖房子一样，地基打得好，任凭风吹雨打，学习python也一样，学习很多东西都会花大量的时间来学习基础语法，对于毫无编程经验的新手而言，这样的无疑是很友好的，那么我们下面讲一讲python的基础语法。控制结构包括条件判断和

pythonxuexi 0喜欢 / 0评论 2020-10-30

非常有用的Python技巧

出现次数最多的 2 个字母

xinhao 0喜欢 / 14评论 2020-10-29

Python 中利用Pandas处理复杂的Excel数据

关于Excel数据处理，很多同学可能使用过Pyhton的pandas模块，用它可以轻松地读取和转换Excel数据。但是实际中Excel表格结构可能比较杂乱，数据会分散不同的工作表中，而且在表格中分布很乱，这种情况下啊直接使用pandas就会非常吃力。本文虫

三石 0喜欢 / 0评论 2020-10-29

Python操作Redis大全

Python操作Redis的redis模块对字符串的主要操作函数包括：SET、GET、GETSET、SETEX、SETNX、MSET、MSETNX、INCR、APPEND、SETRANGE、STRLEN。Python操作Redis主要利用了redis模块来

chaochao 0喜欢 / 11评论 2020-10-27

盘点Python编程语言sys库中的7个常用函数

显示了 sys 的基本文档，看第一句话，概括了本模块的基本特点。这篇文章我们继续盘点sys库中常用的7个函数。当前异常的线程安全信息，退出解释器。获取全局配置函数。该最大层为默认值，可以通过setrecursionlimit方法进行修改。设置递归最大层数。

PythonMaker 0喜欢 / 7评论 2020-10-27

Python中的yield到底是个什么鬼？

相信你已经不止一次在函数中看到关键词yield，它起着什么作用?和return又有着什么区别呢?这篇文章将会揭开yield的神秘面纱，并给出最浅显易懂的例子。如果不太好理解yield，可以先把yield当作return的同胞兄弟来看，他们都在函数中使用，并

jling 0喜欢 / 11评论 2020-10-25

为什么Python中有各种各样的“_”下划线？分别有什么用？

在本文中，我们将介绍 Python 中 _ 字符的不同用法。就像 Python 中的许多其他内容一样，我们会看到 “_” 的不同用法主要是惯例问题。_名称指向交互式解释器会话中，最后执行的语句结果。这首先是由标准CPython解释器完成的，其他解析器也紧

higher0 0喜欢 / 10评论 2020-10-24

零基础学Python：一文看懂数字和字符串

Python3的数字类型分为整型、浮点型、布尔型、分数类型、复数类型。使用Python编写程序时，不需要声明变量的类型。由Python内置的基本数据类型来管理变量，在程序的后台实现数值与类型的关联，以及类型转换等操作。Python与其他高级语言定义变量的方

文山羊 0喜欢 / 0评论 2020-10-20

为什么说 Python 内置函数并不是万能的？

在Python猫的上一篇文章中，我们对比了两种创建列表的方法，即字面量用法 [] 与内置类型用法 list()，进而分析出它们在运行速度上的差异。也就是说，为什么解释器必须经过名称查找，才能“认识”到该做什么呢?其实原因很简单：内置函数/内置类型的名称并不

世事一场大梦 0喜欢 / 0评论 2020-10-18

终于解决了使用Python装饰器中的一个痛点

如何给装饰器的参数传参，这个问题曾经困扰我好久，虽然Python版本的更新，现在这个问题终于解决了，特此记录。这个装饰器的作用很简单，就是获取当前函数的返回值，和传入的count值。我们知道外界调用Demo类传参的唯一途径就是向__init__里进行传参数

FlySky 0喜欢 / 9评论 2020-10-16

如何啃下Python学习中的三块硬骨头

虽然大家普遍认为Python容易学习且用户友好，但是对于初学者来说，他们在学习和使用的过程中，往往也会遇到不同的挑战。下面，我们从Python基本特性出发，和您一起讨论在编程过程中可能碰到的“三块硬骨头”，及其解决方法。Python可以协助发现并纠正初学者

higher0 0喜欢 / 10评论 2020-10-15

Python 疑难问题：[] 与 list() 哪个快？为什么快？快多少呢？

在日常使用 Python 时，我们经常需要创建一个列表，相信大家都很熟练了吧?让我们开门见山，直接抛出本文的问题吧：两种创建列表的 [] 与 list() 写法，哪一个更快呢，为什么它会更快呢?我在 Python3.8 版本实验了几次，总体上 [] 速度是

jling 0喜欢 / 0评论 2020-10-14

Python 3.9来了！这十个新特性值得关注

近日，Python 3.9 发布，并开发了一些新特性，包括字典合并与更新、新的解析器、新的字符串函数等。对于 Python 程序员来说，这又是一个令人兴奋的时刻。相比于之前的版本，Python 3.9 有哪些值得讨论的功能呢？此外，该版本还引入了一种稳定、

CatherineC00 0喜欢 / 0评论 2020-10-14

Python高级技巧：用一行代码减少一半内存占用

我想与大家分享一些我和我的团队在一个项目中经历的一些问题。在这个项目中，我们必须要存储和处理一个相当大的动态列表。测试人员在测试过程中，抱怨内存不足。下面介绍一个简单的方法，通过添加一行代码来解决这个问题。下面我来解释一下，它是如何运行的。首先，我们考虑一

waiwaiLILI 0喜欢 / 10评论 2020-10-13

精心整理！9个 Python 实用案例分享

整理用户输入的问题在编程过程中极为常见。通常情况下，将字符转换为小写或大写就够了，有时你可以使用正则表达式模块「Regex」完成这项工作。但是如果问题很复杂，可能有更好的方法来解决：。但需要注意的是，该操作要使用切片之前的所有生成器项，以及「islice」

meylovezn 0喜欢 / 0评论 2020-10-13

Python 为什么不支持 switch 语句？

在这篇文章里，我们会聊一聊为什么 Python 决定不支持 switch 语句。为什么想要聊这个话题呢?本文除了会详细分析 PEP-275 和 PEP-3103，还会介绍到 Python 最新的发展动态，即可能要引入的模式匹配语法，相信这个话题会开阔大家

yawei 0喜欢 / 0评论 2020-10-09

弄懂这 6 个问题，拿下 Python 生成器！

今天介绍生成器和yield的用法，通过如下8、9个小问题，相信大家会对它们有一点新的认识。可迭代对象，英文Iterable，是一个形容词，这类对象和Java语言类似，都可看作是一类接口，抽象地描述事物具备怎样的能力。除此之外，想必大家也都知道，是使用关键字

Morelia 0喜欢 / 0评论 2020-10-05

让我们来谈谈python中的prettyprint和pprint

当你开始学习python编程的时候，你做的第一件事是什么?相信我们都已经通过“Hello World”程序开始了我们的python之旅。在python中，它可以在一行中完成：。但是，在使用print()函数打印字典、列表或任何其他复杂数据类型时，您是否遇到

taiyangshenniao 0喜欢 / 0评论 2020-10-05

使用 Python 读取 QQ 消息

上一篇文章《使用 Python 自动发送 QQ 消息》发出以后，很多朋友非常感兴趣。还有朋友提出来了，有没有办法取到 QQ 的消息，是不是需要用抓屏，OCR 的方法?其实不用的，微软定义了一套接口 UI Automation 用来自动化测试界面，或者

ericxieforever 0喜欢 / 0评论 2020-09-29

搞定三大神器之 Python 装饰器

装饰器，几乎各大Python框架中都能看到它的身影，足以表明它的价值!它有动态改变函数或类功能的魔力!对于受到封装的原函数比如f来说，装饰器能够在f函数执行前或者执行后分别运行一些代码。def decorator: # 定义要返回的函数 def g():

FlySky 0喜欢 / 0评论 2020-09-29

加快Python运行时速度的10种技巧

Python是一种脚本语言。与C / C ++之类的编译语言相比，Python在效率和性能上有一些缺点。但是，我们可以使用一些技术来提高Python代码的效率。在本文中，我将向您展示我通常在工作中使用的加速技术。测试环境是Python 3.7，macOS

cakecc00 0喜欢 / 0评论 2020-09-28

如何理解python一切都是变量的说法？

Python的好处之一是与其他语法繁重的语言相比，Python具有相对易用的特点。但是，随着深入的学习就会发现Python有许多隐藏的特性贯穿其中，因此学习背后的内容对我们学习是有利的。这使我们想到了一个话题：Python一切都是对象。Python中具有挑

楼上小宇home 0喜欢 / 0评论 2020-09-26

这68个Python内置函数，建议你吃透！

内置函数就是Python给你提供的, 拿来直接用的函数，比如print，input等。截止到python版本3.6.2 ，一共提供了68个内置函数，具体如下。本文将这68个内置函数综合整理为12大类，正在学习Python基础的读者一定不要错过，建议收藏学习

flycony 0喜欢 / 0评论 2020-09-25

Python开发人员最常见的8个错误

大多数python开发人员具有不同的核心编程语言背景，例如java，C＃或c ++。因此，他们习惯于用艰苦的方式做事，而当它们以简单易学的Python语言被引入时，它们会误解Python的多样性和功能，并常常最终导致自己误导其失去某些细微之处。在本文中，我

Dreamhome 0喜欢 / 0评论 2020-09-23

Python中的高阶概念属性：五个你应该搞明白的知识点

在现代编程世界中，面向对象编程语言在改变软件开发中的设计和实现模式方面发挥了进化作用。作为OOP家族的重要成员，Python在过去10年左右逐渐流行起来。与其他OOP语言一样，Python围绕大量不同的对象操作其数据，包括模块、类和函数。在Python中，

flycony 0喜欢 / 0评论 2020-09-23

没有什么内存问题，是一行Python代码解决不了的

内存不足是项目开发过程中经常碰到的问题，我和我的团队在之前的一个项目中也遇到了这个问题，我们的项目需要存储和处理一个相当大的动态列表，测试人员经常向我抱怨内存不足。但是最终，我们通过添加一行简单的代码解决了这个问题。我将在下面解释它的工作原理。举一个简单的

huavhuahua 0喜欢 / 0评论 2020-09-23

Python“王者”地位不保！Julia和Swift后来居上

Python 是20世纪90年代发布的一种通用编程语言。虽然 Python 语法简洁，但它在第一个十年中并不为人所知，也没有真正进入开发人员的工作中。Perl 是首选的脚本语言，Java 已经成为面向对象编程领域的主流。这个发现让非常多开发人员将 Pyt

yuan00yu 0喜欢 / 0评论 2020-09-22

弄懂这 5 个问题，拿下 Python 迭代器！

本篇专题写作思路，由几个问题，逐步讨论迭代器存在的价值、使用的方法、以及如何转化为自身武器并真正用到日常Python中。迭代器，英文 Iterator，它首先是个对象，其次它是访问可迭代序列的一种方式。迭代器又是一个特殊的对象，特殊在于它必须实现两个方法

JnX 0喜欢 / 0评论 2020-09-21

Python 之父为什么嫌弃 lambda 匿名函数？

Python 支持 lambda 匿名函数，其扩展的 BNF 表示法是lambda_expr ::= "lambda" [parameter_list] ":" expression，也就是lambda 参数序列:

meylovezn 0喜欢 / 0评论 2020-09-21

Python神器函数sorted()：3个您不得不看的特性

作为一种通用语言，Python已在各种学术和工业领域逐渐流行，用于科学计算，工程，Web开发和许多其他用途。Python的一项引人入胜的功能是它是如此灵活，以至于同一功能可以有多个实现。让我们考虑以下简单的示例。显然，我们能够以相同顺序在列表中获得。尽管s

cakecc00 0喜欢 / 0评论 2020-09-19

【Python进阶】掌握这些骚技巧，99%的文件操作都游刃有余！

处理文件是我们几乎每天都躲不开的任务之一。Python中含有几个用于执行文件操作的内置模块，例如读取文件，移动文件，获取文件属性等。本文总结了许多值得了解的函数，这些函数可用于进行一些Python中最常见的文件操作，可以极大地提高我们处理文件的效率。读取或

diyanpython 0喜欢 / 0评论 2020-09-18

Python语言的精华：Itertools库

你知道Python的Itertools库被认为是Python的瑰宝吗?一些用户甚至认为它是最酷和最令人惊叹的Python库之一。我们可以使用Itertools模块来丰富我们的应用程序，并在更短的时间内创建一个可靠的工作解决方案。本文将帮助读者理解如何在项目

joyjoy0 0喜欢 / 0评论 2020-09-18

Python进阶版：定义类时应用的9种最佳做法

本文转载自公众号“读芯术”。作为一种OOP语言，Python通过支持以对象为主的各种功能来处理数据和功能。尽管可以使用内置数据类型，而且无需创建任何自定义类就能编写一组函数，但随着项目范围的扩大，代码可能会越来越难维护。这些单独代码部分的主题并不相同，尽管

jacktangj 0喜欢 / 0评论 2020-09-18

python装饰器不改变原函数属性,带参装饰器

def copy_properties: # 提供一个函数,被封装函数属性 copy 到包装函数属性,保持被封装函数属性不变。import datetime,timedef copy_properties: def wrapper: d

bizercsdn 0喜欢 / 0评论 2020-09-17

了解这些操作，Python中99%的文件操作都将变得游刃有余！

处理文件是我们几乎每天都躲不开的任务之一。Python中含有几个用于执行文件操作的内置模块，例如读取文件，移动文件，获取文件属性等。本文总结了许多值得了解的函数，这些函数可用于进行一些Python中最常见的文件操作，可以极大地提高我们处理文件的效率。读取或

dflyzx 0喜欢 / 0评论 2020-09-17

逐步展开Python详细教学—共享Python经验

在我们开始正文之前，我想知道您为什么学习Python。通过评论来分享你的学习经验和学习过程。我们会在内容中逐步针对读者进行Python讲解。Python编程语言是一种面向对象的语言，这意味着它可以模拟真实世界的实体。Python编程语言诞生于20世纪80年

YENCSDN 0喜欢 / 0评论 2020-09-15