秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

让谣言止于“人工智能”，仅需要1秒钟的时间。

天下网商记者黄天然

“谎言飞奔，真理跛行其后。”

英国作家乔纳森·斯威夫特留下的这句话，在如今依然适用。

从去年年底“杭州城管血腥虐杀流浪狗”的谣言引发舆情汹涌、到“一个寒门状元之死”虚构故事刷屏……在信息疯长、传播异常快速的社交媒体时代，朋友圈里时不时就会出现一场关于虚假新闻的风波。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

据麻省理工大学的大规模研究《网络中真实与虚假消息的传播》对比实验，通过推特上300万用户转发过的12.6万条新闻的跟踪研究，无论哪种分类信息——政治、娱乐和生活等，假消息都比真消息传播得更快速、更广泛。

因此，容易沦陷朋友圈谣言的不仅仅是不熟悉新媒体套路的长辈们，在那些披着科学与新闻故事的外衣的谬误面前，我们每个人都深受其蛊惑。统计数据显示，“微信辟谣助手”上线未满两年，已辟谣文章数就达到了119.92万篇。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

在海量信息肆意横行的社交媒体时代，如何破解谣言难题？

最近，达摩院的科学家们在用AI识别网络谣言的研究上实现新的突破。在刚刚结束的SemEval国际权威语义测试中，达摩院机器智能实验室自然语言处理（NLP）团队创造了谣言识别81%的准确率刷新世界纪录。

“谣言粉碎机”走入我们的社交媒体中，帮助净化网络环境，已经并不遥远。

三招之内让谣言“原形毕露”

达摩院NLP团队核心成员之一李泉志是“谣言粉碎机”的主要研发专家，本科毕业于清华大学的他，而后在美国获得自然语言理解方向的博士学位，目前在达摩院西雅图办公室工作。

在加入达摩院前，他曾是世界级通讯社——路透社重要的“情报官”：通过机器筛选成千上万的网络信息，为数千位一线记者提供可靠线索。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

达摩院机器智能实验室科学家李泉志

“运用AI处理谣言本身就是我们长期研究的方向，社交媒体的蓬勃发展，对于新闻源的判断尤其重要。我们对不同语言的谣言都在研究之中，中国的谣言大多是生活类常识类，而美国的是政治类居多。自达摩院建立以来，我们就开始启动了这项研究。”泉志说。

在研发“谣言粉碎机”的过程中，泉志模拟了人脑的思维的过程，同时发挥AI的特有优势，让谣言的判断可以快速实现。

相比人为的搜索和查证，AI能够更快速和精准地在盘根错节的网络信息里找到最初的信源。分析信源链接的域名，是否来自具有公信力的网站，挖掘出发布信源者的画像。通过发布者在不同社交媒体上的动态与现实生活中的公开信息（专业领域、过去发表内容类型、个人所属的机构、地域、活跃规律等）判断其信誉度。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

然后，AI就可以对文章中关键的论证提炼为信息要素，自动化地进行与维基百科、专业学术文献库等知识图谱里的权威知识库做匹配验证。如果发现内容毫无联系、偷换概念、相互冲突，则将立即列入可疑消息的行列。

第三步，对传播路径的深入分析。这可是关键“大招”，一条谣言在社交网络里引爆，其中经过了几次传播？阅读后用户的反馈是肯定，还是反驳和质疑？是否有权威网站转载支撑？AI都可以挖掘出来，由此找到消息传播的增减规律、生成评论和传播消息的用户画像。

这样的统计不仅能统计所有用户的态度，它还会区别对待每条发言的分量。如果行业领域专家、影响力较高的知名人士对于新闻赞同，将增加新闻被判定为真实的权重。

“AI经过语言学训练，还能够读懂评论是否是人类的反话和嘲讽，用语情绪是高兴还是愤怒，连同用户浏览文章的动机和意图都会纳入判断消息真实性的过程。”泉志说。

经过三步中计算出的信息会输入到神经网络模型中，基于这些信息，模型会综合判断出此新闻是否为谣言。凭借强大的机器智能计算能力，三个步骤自动同时进行，最快在1秒内就能得到结论。

2亿条推特信息训练出“世界冠军”

有了这样的神经网络模型，AI就能像一个超级大脑一样“思考”。随着处理的数据库的日益庞大，它的判断能力会越来越好。

为了训练AI“谣言粉碎机”，达摩院NLP团队运用2亿条推特信息、来自上百万条新闻作为素材建立语义网络的最底层，再输入与各类新闻相关的权威知识库建立起了庞大的上层架构。“谣言粉碎机”就如同一个全知全能的“网络警察”，可获知每条新闻的事实来源与反馈情况，了解消息传播的路径和爆发扩散相关的关键人物与时间节点，第一时间发现可疑虚假信息，遏制其扩散势头。

泉志告诉记者，这项技术不仅能控制谣言源头，还能防止大规模扩散，“根据传播路径索引，我们可以针对曾经支持过谣言的人，定向推送官方的辟谣信息，改变造谣容易、辟谣难的局面。比如向相信‘食物相克’谣言的人科普正确的膳食常识，告诉曾经转发过‘酸碱体质说’的用户这是骗局等等。”

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

在这届SemEval全球语义测试，共有来自哥伦比亚大学、华盛顿大学、艾伦·图灵研究所等20多所研究机构参与。所有参赛者需要根据推特和红迪网上470余条新闻、以及一万多条留言、转发等数据，判断这些新闻的真假。

达摩院NLP团队脱颖而出获得第一，还刷新了本竞赛系列上macro F、RMSE两项关键性指标的世界纪录。达摩院语言技术实验室首席科学家司罗表示，随着社交媒体使用率提升，人工审核的团队越来越庞大，脸书目前已有7000人的人工审核团队，阿里达摩院AI“谣言粉碎机”有望帮助社交媒体的审核机构承担60%的工作量。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

在此之前，达摩院NLP团队曾在机器阅读理解顶级赛事SQuAD上，凭借82.440的精准率打破了历史纪录；在国际顶级机器翻译大赛WMT上，连夺英文—中文翻译、英文—俄语互译、英文—土耳其语互译5项第一。

在互联网时代，从海量信息中即时快速地获取信息成为每个人的基本诉求。让AI成为人类大脑的延伸、读懂人类的语言，对抗人们爱让“谣言传千里”的“本性”，建立起更高效的语言与数据传播路径，达摩院的科学家们一直在不断刷新着世界纪录，攻克下一座又一座全球技术的高地。

秒速攻破朋友圈谣言！达摩院造出AI“谣言粉碎机”

三招之内让谣言“原形毕露”

2亿条推特信息训练出“世界冠军”

相关推荐