python识别图片文字

懒人在思考 2018-04-21

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，而看视频是不可能看视频的，这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下：

手机屏幕投影到电脑上；
截图并识别图片文字；
调用百度来进行搜索；
提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

要识别中文，ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
2 tesseract_cmd = 'tesseract'
3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
4 img_mode = 'RGB'

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 import<span> pyautogui as pag
2 x,y =<span> pag.position()
3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4<span>)
4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

from PIL import Image
 from PIL import ImageGrab
 import pytesseract
 import webbrowser
 
 pos = (0,245,425, 327)
 cut_img = ImageGrab.grab(pos)
 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中
 print("screenshots sucess")
 
 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别
 text=text.replace(" ","") #去空格
 print(text)
 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索
 webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，其实是懒。

: 懒人在思考

相关推荐

Android 图片文字识别DEMO（基于百度OCR）

OCR 是 Optical Character Recognition 的缩写，翻译为光学字符识别，指的是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技

alanlonglong 0喜欢 / 0评论 2020-06-14

C# 调用百度AI接口实现文字识别

今天心血来潮做了个识别图片文字的demo，现在文字识别技术已经比较成熟了，而且还有可以调用的公共接口。今天做的demo主要简单对比了Tesseract-OCR和BAIDU.AI 这两种方法，感觉百度的中文识别准确率更高，Tesseract-OCR中文别准确

人工智能快报 0喜欢 / 0评论 2020-06-09

Python怎么识别文字？正确的方法详解

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。将图像翻译成文字一般被称为光学文字识别。可以实现OCR的底层库并不多，目前很多库都是使用共同的几个底层OCR库，或者是在上面进行定制。在

alanlonglong 0喜欢 / 0评论 2020-06-02

机器学习基础---应用实例（图片文字识别）和总结

首先，展示一个复杂的机器学习系统是如何被组合起来的；最后，介绍一下照片OCR问题，展现机器学习中有用的想法和概念，其中之一就是应用在计算机视觉问题中，另一个是人工数据合成的概念。讨论一种滑动窗口分类器的方法。标准的做法是绘制一个学习曲线来确保有一个低偏差、

PeterHuang0 0喜欢 / 0评论 2020-05-26

OCR文字识别技术为人工智能添彩

当代可为是一个科学技术的社会，日新月异的科学技术正在飞速发展，生活中处处都能感受到科学技术就在身边以强有力的步伐在发展。科技的魅力就在于它正在改变着我们的生活，同时改变着世界。经过多年的创新与发展，文通科技现已成长为国内知名的高新技术企业，在全国十余个城市

luoyouren 0喜欢 / 0评论 2019-10-29

Readiris Corporate 17 for Mac(专业光学识别OCR软件)

Readiris Corporate 17 Mac是一款功能强大的专业光学识别OCR软件，可识别128种文字语言！Readiris Corporate Mac能够帮助你将纸张、PDF文件、图片文字的文字元素扫描成文字，具有自动识别和自动分析的功能，识别效率

Charliewolf 0喜欢 / 0评论 2019-10-22

SaaS平台开启文字识别新渠道

OCR技术作为其中最实用的分支之一，早几年便在应用市场中占有一席之地。基于OCR技术开发的产品种类繁多，包括文档识别、名片识别、证件识别、票据识别等等，几乎每一项应用都能在工作生活中发挥重要的作用。不过，对于一些刚起步的中小型企业来说，要将所需OCR产品统

IT互联网技术学习 0喜欢 / 0评论 2019-02-12

利用百度AI OCR图片识别，Java实现PDF中的图片转换成文字

我们搞技术的，当然得自己学着解决现在的痛点。首先，说说一些在线版的PDF图片转文字，对文件大小有限制为2M，超过了便要收费了。

chenzhx 0喜欢 / 0评论 2019-09-06

如何使用Python进行OCR识别图片中的文字

OCR1，全称Optical character recognition，或者optical character reader，中文译名叫做光学文字识别。它是把图像文件中的手写文本，打印文本转换为机器编码文本的一种方法。OCR技术广泛用于识别打印纸张中的文

我心飞翔之家 0喜欢 / 0评论 2019-04-01

SaaS平台开启文字识别新渠道

OCR技术作为其中最实用的分支之一，早几年便在应用市场中占有一席之地。基于OCR技术开发的产品种类繁多，包括文档识别、名片识别、证件识别、票据识别等等，几乎每一项应用都能在工作生活中发挥重要的作用。不过，对于一些刚起步的中小型企业来说，要将所需OCR产品统

visionarywind 0喜欢 / 0评论 2019-02-12

[译]OpenCV OCR and text recognition with Tesseract

几周前,我向您展示了如何执行文本检测使用OpenCV的EAST深度学习模型。下一步是把这些区域包含文本和实际识别和OCR文字使用OpenCV和Tesseract。为了执行 OpenCV OCR 和文本识别任务，我们首先需要安装 Tesseract v4，包

Jasterwisdom 0喜欢 / 0评论 2019-07-01

OCR：精准、稳定、易用的文字识别

大家好，今天给大家介绍精准、稳定、易用的文字识别应用服务OCR。由此可见OCR实际上是让计算机认字，实现文字的自动输入，它是一种快捷、省力、高效的文本输入方法。需要注意的是OCR是指文字识别，但是OCR所采用的技术不仅仅是适用于文字识别。华为云学院现已发布

LinBSoft 0喜欢 / 0评论 2019-07-01

如何精准实现OCR文字识别？

欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~前言2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动，活动举办期间用户耐心听分享嘉宾的介绍，并提出了相关的问题，智能图像团队的科学家

nanqi 0喜欢 / 0评论 2019-06-28

百度是如何做OCR结构化处理的？|技术头条

OCR技术是目前常用的一种AI能力。但一般OCR的识别结果是一种按行输出的半结构化输出。本次公开课我们邀请到了百度高级研发工程师向宇波老师，他将在12月20日（周四）带来一场主题为《基于模板的文字识别结果结构化处理技术》的分享。

我心飞翔之家 0喜欢 / 0评论 2019-05-04

python做文字识别一行代码都不用！（内附python教程分享）

今天，我们用Python实现对图像文字的识别，很简单！利用的库是pillow和pytesseract。pytesseract需要从网上下载，也很方便。基本上所有的文字都能识别，当然不可避免也会有一些乱字出现，这个库对于识别文字的能力还需提高，但简单的识别验

AndroidAmelia 0喜欢 / 0评论 2019-03-11

扣丁学堂Python培训之Python基于百度AI的文字识别的示例

对Python感兴趣的小伙伴现在就随扣丁学堂的小编一起来了解一下吧。使用百度AI的文字识别库，做出的调用示例，其中filePath是图片的路径，可以自行传入一张带有文字的图片，进行识别。下载baidu-aip这个库，可以直接使用pip下载：pip inst

一叶不知秋 0喜欢 / 0评论 2018-12-10

谷歌开源深度学习街景文字识别模型：让地图随世界实时更新

谷歌地图的街景功能拥有 800 亿张高分辨率图片，而且这个数字还在以每天百万的速度不断增加。街景图片是获取准确地理信息的绝佳渠道，而利用深度学习从图片中获取信息，并实时更新地图地址内容正是谷歌研究团队努力的目标。每一天，谷歌地图都会为数百万人指路，并提供相

timcompp 0喜欢 / 0评论 2017-05-04

python编程实现《吃鸡》文字识别自动搜索功能

《吃鸡》游戏最近很火。笔者也不息在玩，不外高中的知识都还给教员了。10秒的答题时辰让人根柢来不及去百度搜索。于是我建造了这个剧本，对问题问题停止文字识别，主动翻开网页停止搜索。首先来看一下测试成效：。安卓手机毗连电脑，经由过程adb调试实现敌手机答题页面的

heshenhan 0喜欢 / 0评论 2018-04-07

python实现《吃鸡大法》加文字识别玩转百万英雄！

《百万英雄》比较火。最近我也在玩，把高中的知识都还给教员了。10秒的答题时辰让人根柢来不及去百度搜索。于是我建造了这个剧本，对问题问题停止文字识别，主动翻开网页停止搜索。首先来看一下测试成效：。安卓手机毗连电脑，经由过程adb调试实现敌手机答题页面的截屏，

sulindong0 0喜欢 / 0评论 2018-03-28

Python文字识别就这么简单-对比pillow，wandTesseract的使用

今天我们来说一下，如何使用python识别PDF中的文字。今天，我们用Python3, pillow, wand和三个python包，分别是Tesseract下的：textract，pytesseract和pyocr。下面的内容，同样也适用于普通文本，但是

qiximiao 0喜欢 / 0评论 2018-11-30

Ubuntu 14.04下PDF 文字识别工具gscan2pdf

我们将文档扫描成 PDF 格式比较容易，但是你能搜索它的内容吗？不过现在gscan2pdf采用光学识别软件对您的 PDF 文档进行扫描并将图像转换为文字就比较容易。下面就说说在Ubuntu 14.04下安装最新版的PDF 文字识别工具gscan2pdf的简

朱本福 0喜欢 / 0评论 2014-05-20

python 3调用百度OCR API实现剪贴板文字识别

本程序调用百度OCR API对剪贴板的图片文字识别，配合CaptureScreen软件，可快速识别文字。print以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持安科网。

castingAT 0喜欢 / 0评论 2018-09-04

python 识别图片中的文字信息方法

最近朋友需要一个可以识别图片中的文字的程序，以前做过java验证码识别的程序；刚好最近在做一个python项目，所以顺便用Python练练手。本地环境是ubuntu，下面说一下具体步骤：。使用python 3.4安装时;将pip 命令修改为pip3(都知

taku 0喜欢 / 0评论 2018-05-10

Python图像处理之识别图像中的文字(实例讲解)

执行命令：pip install E:\360安全浏览器下载\autopy3-0.51.1-cp36-cp36m-win_amd64.whl. 这里要说明的是安装Tesseract-OCR后，其不会被默认添加至环境变量path中，已导致如下报错：。解决办法

zhuma的编程学习 0喜欢 / 0评论 2018-05-10

腾讯数平精准推荐 | OCR技术之检测篇

在过去的数年中，腾讯数平精准推荐团队一直致力于实时精准推荐、海量大数据分析及挖掘等领域的技术研发与落地。特别是在广告推荐领域，团队自研的基于深度在线点击率预估算法及全流程实时推荐系统，持续多年在该领域取得显著成绩。而在用户意图和广告理解上，借助于广告图片中

alanlonglong 0喜欢 / 0评论 2019-04-22

数平精准推荐 | OCR技术之数据篇

如图fig.2所示，OCR的作用是检测图像中的文字区域以及识别文字内容。相比物体检测识别，OCR由于包含倾斜文本框，低分辨率文字，以及文本版面多样化，因此OCR数据标注具有特殊性，标注成本更高。

羽化成蝶 0喜欢 / 0评论 2019-04-22

GAITC分论坛实录丨金连文：文字识别：技术现状、挑战及机遇

刘成林/主持人：下一位报告人是华南理工大学的金连文教授。自从有了深度学习技术之后，文字识别这个事情变得简单多了，我们现在利用相关的深度学习技术如CNN、DNN、RNN，可以把这个问题解决的很好。

DoctorCuiLab 0喜欢 / 0评论 2017-05-31

Python基于百度云文字识别API

百度云提供的文字识别技术，准确率还是非常高的，而且每天还有5w次免费的调用量，对于用来学习或者偶尔拿来用用，已经完全足够了。文章提供一个模板，稍加修改就可以直接套用。注释中提到必须输入的地方，你都正确地输入了的话，就可以完成一次简单的文字识别了。acces

pythonpycharm 0喜欢 / 0评论 2018-12-13

python利用百度AI实现文字识别功能

本文为大家分享了python实现文字识别功能大全，供大家参考，具体内容如下。# 调用通用文字识别接口。识别一些网络上背景复杂，特殊字体的文字。options["detect_direction"] = "true"

PythonGCS 0喜欢 / 0评论 2018-11-27

python实现简单的文字识别

百度云提供的文字识别技术，准确率还是非常高的，而且每天还有5w次免费的调用量，对于用来学习或者偶尔拿来用用，已经完全足够了。文章提供一个模板，稍加修改就可以直接套用。注释中提到必须输入的地方，你都正确地输入了的话，就可以完成一次简单的文字识别了。acces

wlpython 0喜欢 / 0评论 2018-11-27

Python3一行代码实现图片文字识别的示例

自学Python3第5天，今天突发奇想，想用Python识别图片里的文字。没想到Python实现图片文字识别这么简单，只需要一行代码就能搞定。我们运行代码后识别的结果,有几个字没有正确识别，但是大多数字都能识别出来。这里我们需要用到两个库：pytesser

LHpython 0喜欢 / 0评论 2018-01-15

图像文字识别—人工智能的慧眼

人类对世界的感知大约80%是通过视觉获取的，因此，如何让计算机具备甚至超越人类的视觉能力一直以来都是科学研究的重要方向。图像文字识别技术是计算机视觉技术的重要组成部分，在日常生活中具有重要的价值和意义。

luoyouren 0喜欢 / 0评论 2018-04-12

微信OCR（2）：深度序列学习助力文字识别

此篇文章属于微信OCR技术介绍系列，着重介绍如何采用深度序列学习方法实现端到端的文本串识别并应用于微信产品。本篇主要为方法综述，下一篇着重介绍深度序列学习技术在微信产品中的落地。这里，文本串识别的输入默认已经是包含文本的最小外接矩形框，其目的是识别其中的文

xiangfreedom 0喜欢 / 0评论 2017-09-21

破解人类识别文字之谜，对图像中的字母进行无监督学习

Nature 子刊 Nature Human Behavior 上最新发表了一篇关于人类行为的研究，通过对自然图像中的字母进行无监督学习，探讨了人类是如何获得文字识别能力的。研究人员提出了一个基于深度神经网络的大规模字母识别计算模型，通过将概率生成模型与

wjschaoren 0喜欢 / 0评论 2017-08-29

iText 新年新版：截图识别文字后，翻译为 100+ 种语言

iText 是一款从图片中识别文字的工具，解决了诸如扫描版 PDF 无法复制等问题。在保持简洁的同时，我也在不断改进 iText 的功能和便利性。新年第一版，来看看有哪些变化吧。识别文字后自动翻译使用场景：比如，对于英文版的 PDF、未翻译的字幕、未汉化

稀土 0喜欢 / 0评论 2018-01-02

有了 iText，你截图，腾讯、Google OCR 帮你识别文字

比如，在看类似上面的扫描版 PDF 时，想要复制其中的文字，怎么办？试试我新开发的工具 iText 吧。iText 是 macOS 平台的 OCR 工具，自带截图功能，选择屏幕任意区域，即可识别其中的文字，又爽又酷。配合 1 快捷键，使用体验更佳。当然，你

稀土 0喜欢 / 0评论 2017-11-30

爬虫——文字识别

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。验证码读取的难易程序也大不相同。将图像翻译成文字一般被称为光学文字识别。可以实现OCR的底层库并不多，目前很多库都是使用共同的几个底层O

软件设计 0喜欢 / 0评论 2017-07-25