数据科学家必须知道的前十大Python库

jcwang 2020-08-03

Python是比较流行和广为人知的编程语言之一,它已取代了业界的许多编程语言。它是数据科学专业人士比较喜欢使用的编程语言之一,因为它拥有庞大的库。

数据科学家必须知道的前十大Python库

Python因其简单易用而被称为初学者级编程语言,它的编程语法易于学习,并且与C,Java和C ++相比具有较高的水平。

为了获得更准确的算法和编码,Analytics Insight给出前10个Python库

PyTorch

Pytorch是一个开源库,它基本上替代了Numpy。 PyTorch带有高级功能,可用于构建深度神经网络。数据科学专业人士仍然可以使用其他语言,例如scipy,Cython和numpy,这些语言可在需要时帮助扩展PyTorch。 Pytorch被包括Facebook,Twitter,Nvidia,Uber在内的许多组织所使用,用于快速建立研究原型并训练深度学习模型。

GitHub:https://github.com/pytorch/pytorch

Arrow

Arrow是一个人类友好的Python库,它提供了诸如对日期,时间和时间戳进行转换,操纵,创建和格式化的功能。它支持Python 2和3,它是DateTime的替代方法,它具有更好的界面,以促进丰富的功能。

GitHub:https://github.com/crsmithdev/arrow

IPython

这是最有用的python工具之一,为用户提供了丰富的体系结构。使用IPython,用户可以在其浏览器中编写和执行python代码。 Ipython可在多种操作系统上运行,包括Windows,Mac OS X,Linux和大多数其他Unix OS。 Ipython为用户提供了更多功能,包括帮助功能,高级编辑等。

GitHub:https://github.com/ipython/ipython

TensorFlow

Tensor flow是由Google Brain团队创建的开源机器学习python库。 Tensor流库用于开发,训练和设计深度学习模型,并且可以用于进行数值计算。 Tensor Flow是Theano的替代产品,它可以在移动设备,单CPU系统和GPU上运行。

GitHub:https://github.com/tensorflow/tensorflow

Caffe2

Caffe2是将Caffe框架带入现代世界的尝试。它支持分布式培训,甚至可以在移动平台中进行部署。虽然PyTorch可能更适合研究,但Caffe2适合进行大规模部署,如Facebook上所示。

GitHub:https://github.com/caffe2/caffe2

Scrapy

Scrappy是一个广泛使用的Python Web抓取库。 Scrappy最初用于创建爬网程序,ands 则专门用于抓取,如其名称所示。现在它用于多种用途,包括数据挖掘,自动化测试等。scrapy是开源的,必须具有库。

GitHub:https://github.com/scrapy/scrapy

Requests

Requests是著名的Python库之一,该库在Apache2下获得许可并用Python编写。该库可帮助用户与多种语言进行交互。借助Requests库,用户可以手动将字符串串接到其URL。他们可以使用Request 库将HTTP请求发送到服务器,并且可以添加表单数据,内容(如标头,多部分文件等)。

GitHub:https://github.com/requests/requests

Zappa

Zappa是由Miserlou创建的比较好的python软件包之一,它很容易在API Gateway和Amazon Web Services Lambda上构建和实现无服务器应用程序。由于AWS自动处理水平扩展,因此没有请求会超时。使用Zappa,您可以使用Zappa在一行中更新代码。

GitHub:https://github.com/Miserlou/Zappa

Flashtext

FlashText是更好的选择,它的优点包括,无论用户有多少个搜索词,其运行时间都是相同的,而regexp则相反,运行时间几乎随词的数量线性增加。

GitHub:https://github.com/vi3k6i5/flashtext

Fire

相关推荐