AI 破解谷歌人机鉴别系统，文本验证码或将离场

魔高一尺，道高一丈。在这场人工智能与人机鉴别技术的博弈中，到底谁将更胜一筹？

来源 | IEEE Spectrum

作者 | Charles Q. Choi

编译 | Rik R

最近，一项新的研究发现，通过模拟人类视觉的工作原理，人工智能软件可以击败谷歌的 reCAPTCHA 人机鉴别验证码系统，这也是世界上使用最广泛的用于区分人类与电脑的全自动图灵测试。

科学家们补充道，这项发现不仅表明人们需要更强大的自动化人机鉴别技术，也有助于提升计算机在执行机器人任务中的感知能力。

AI 破解谷歌人机鉴别系统，文本验证码或将离场

计算机科学之父艾伦·图灵构思了图灵测试，其中最为知名的一个设想为，是否可以设计出一种能够在文本对话中模仿人类的机器，让旁人无法分辨出二者的差异。在进行试验的过程中，图灵促成了人工智能领域的发展。

最常用的图灵测试是 CAPTCHA，即「用来分辨计算机和人类的全自动公共图灵测试（Completely Automated Public Turing test to tell Computers and Humans Apart）」的缩写。CAPTCHA 被用于分辨用户是否为人类，也经常被用于阻止机器人访问计算服务。CAPTCHA 通常会让网站访问者识别一串扭曲的字母和数字，或者是回答一个对计算机来说很难、对人类却很容易的问题。

一般情况下，如果一个算法的识别成功率达到 1%，就可以认为它成功破解了 CAPTCHA。目前，位于旧金山湾区的初创公司 Vicarious 透露，其人工智能软件的 CAPTCHA 识别准确率已经可以达到 66.6%，BotDetect 是 64.4%，雅虎是 57.1%，PayPal 是 57.4%。

Vicarious 开发的系统被称为递归神经网络（Recursive Cortical Network，RCN）。这是一个用来模仿大脑工作方式的人工神经网络。在这种系统中，被称为人工神经元的各个部件会接受外部输入的数据，并相互合作解决诸如识别文本或语音等问题。然后，神经网络可以改变这些神经元之间的连接模式，从而改变它们相互作用的方式，接下来网络又会再次试图解决这个问题。随着时间的推移，神经网络会知道哪种模式最适合用于计算解决方案。（详情可见：学界 | Vicarious 发表 Science 论文：概率生成模型超越神经网络）

AI 破解谷歌人机鉴别系统，文本验证码或将离场

此前的神经网络也可以攻破 reCAPTCHA，但需要对数百万张标记过的 CAPTCHA 图像样本进行训练，或者人工标定破解各种图像的方式，而 Vicarious 的系统只需要较少的训练数据。与用最先进的深度学习神经网络来阅读文本相比，Vicarious 递归神经网络能够在使用大约三百分之一的训练数据的情况下，具备与之相当或更高的精度。

「我们的系统已经有能力使用相对较少的样本进行学习，就像人的大脑。」研究负责人 Dileep George 说道，他是 Vicarious 的联合创始人。

Vicarious 称其成功的关键是：在模仿人类大脑的视觉系统之后建模递归神经网络。该公司解释说，递归神经网络的人工神经元是结构化的，因此得以支持模型的生成。这些模型能够快速地识别表面和轮廓，进而能够通过有限的图像和对象样本来辅助识别。

「这些研究结果表明基于文本的 CAPTCHA 已经过时了。」George 说道。他指出，谷歌和其它公司已经从基于文本的 CAPTCHA 转向了新的验证机制，比如依赖于基于图像的 CAPTCHA。

研究人员指出，他们的软件还可以应对与计算机感知相关的其它挑战。「我们正将其应用在许多机器人任务中。」George 说道，「可以想象一下，机器人不仅要识别对象，还要与其进行交互。这就需要建立一个行为反应模型来应对各种情况。」

AI 破解谷歌人机鉴别系统，文本验证码或将离场

相关推荐