秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

Monstarlab 2019-03-01

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

让谣言止于“人工智能”,仅需要1秒钟的时间。

天下网商记者 黄天然

“谎言飞奔,真理跛行其后。”

英国作家乔纳森·斯威夫特留下的这句话,在如今依然适用。

从去年年底“杭州城管血腥虐杀流浪狗”的谣言引发舆情汹涌、到“一个寒门状元之死”虚构故事刷屏……在信息疯长、传播异常快速的社交媒体时代,朋友圈里时不时就会出现一场关于虚假新闻的风波。

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

据麻省理工大学的大规模研究《网络中真实与虚假消息的传播》对比实验,通过推特上300万用户转发过的12.6万条新闻的跟踪研究,无论哪种分类信息——政治、娱乐和生活等,假消息都比真消息传播得更快速、更广泛。

因此,容易沦陷朋友圈谣言的不仅仅是不熟悉新媒体套路的长辈们,在那些披着科学与新闻故事的外衣的谬误面前,我们每个人都深受其蛊惑。统计数据显示,“微信辟谣助手”上线未满两年,已辟谣文章数就达到了119.92万篇。

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

在海量信息肆意横行的社交媒体时代,如何破解谣言难题?

最近,达摩院的科学家们在用AI识别网络谣言的研究上实现新的突破。在刚刚结束的SemEval国际权威语义测试中,达摩院机器智能实验室自然语言处理(NLP)团队创造了谣言识别81%的准确率刷新世界纪录。

“谣言粉碎机”走入我们的社交媒体中,帮助净化网络环境,已经并不遥远。

三招之内让谣言“原形毕露”

达摩院NLP团队核心成员之一李泉志是“谣言粉碎机”的主要研发专家,本科毕业于清华大学的他,而后在美国获得自然语言理解方向的博士学位,目前在达摩院西雅图办公室工作。

在加入达摩院前,他曾是世界级通讯社——路透社重要的“情报官”:通过机器筛选成千上万的网络信息,为数千位一线记者提供可靠线索。

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

达摩院机器智能实验室科学家 李泉志

“运用AI处理谣言本身就是我们长期研究的方向,社交媒体的蓬勃发展,对于新闻源的判断尤其重要。我们对不同语言的谣言都在研究之中,中国的谣言大多是生活类常识类,而美国的是政治类居多。自达摩院建立以来,我们就开始启动了这项研究。”泉志说。

在研发“谣言粉碎机”的过程中,泉志模拟了人脑的思维的过程,同时发挥AI的特有优势,让谣言的判断可以快速实现。

相比人为的搜索和查证,AI能够更快速和精准地在盘根错节的网络信息里找到最初的信源。分析信源链接的域名,是否来自具有公信力的网站,挖掘出发布信源者的画像。通过发布者在不同社交媒体上的动态与现实生活中的公开信息(专业领域、过去发表内容类型、个人所属的机构、地域、活跃规律等)判断其信誉度。

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

然后,AI就可以对文章中关键的论证提炼为信息要素,自动化地进行与维基百科、专业学术文献库等知识图谱里的权威知识库做匹配验证。如果发现内容毫无联系、偷换概念、相互冲突,则将立即列入可疑消息的行列。

第三步,对传播路径的深入分析。这可是关键“大招”,一条谣言在社交网络里引爆,其中经过了几次传播?阅读后用户的反馈是肯定,还是反驳和质疑?是否有权威网站转载支撑?AI都可以挖掘出来,由此找到消息传播的增减规律、生成评论和传播消息的用户画像。

这样的统计不仅能统计所有用户的态度,它还会区别对待每条发言的分量。如果行业领域专家、影响力较高的知名人士对于新闻赞同,将增加新闻被判定为真实的权重。

“AI经过语言学训练,还能够读懂评论是否是人类的反话和嘲讽,用语情绪是高兴还是愤怒,连同用户浏览文章的动机和意图都会纳入判断消息真实性的过程。”泉志说。

经过三步中计算出的信息会输入到神经网络模型中,基于这些信息,模型会综合判断出此新闻是否为谣言。凭借强大的机器智能计算能力,三个步骤自动同时进行,最快在1秒内就能得到结论。

2亿条推特信息训练出“世界冠军”

有了这样的神经网络模型,AI就能像一个超级大脑一样“思考”。随着处理的数据库的日益庞大,它的判断能力会越来越好。

为了训练AI“谣言粉碎机”,达摩院NLP团队运用2亿条推特信息、来自上百万条新闻作为素材建立语义网络的最底层,再输入与各类新闻相关的权威知识库建立起了庞大的上层架构。“谣言粉碎机”就如同一个全知全能的“网络警察”,可获知每条新闻的事实来源与反馈情况,了解消息传播的路径和爆发扩散相关的关键人物与时间节点,第一时间发现可疑虚假信息,遏制其扩散势头。

泉志告诉记者,这项技术不仅能控制谣言源头,还能防止大规模扩散,“根据传播路径索引,我们可以针对曾经支持过谣言的人,定向推送官方的辟谣信息,改变造谣容易、辟谣难的局面。比如向相信‘食物相克’谣言的人科普正确的膳食常识,告诉曾经转发过‘酸碱体质说’的用户这是骗局等等。”

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

在这届SemEval全球语义测试,共有来自哥伦比亚大学、华盛顿大学、艾伦·图灵研究所等20多所研究机构参与。所有参赛者需要根据推特和红迪网上470余条新闻、以及一万多条留言、转发等数据,判断这些新闻的真假。

达摩院NLP团队脱颖而出获得第一,还刷新了本竞赛系列上macro F、RMSE两项关键性指标的世界纪录。达摩院语言技术实验室首席科学家司罗表示,随着社交媒体使用率提升,人工审核的团队越来越庞大,脸书目前已有7000人的人工审核团队,阿里达摩院AI“谣言粉碎机”有望帮助社交媒体的审核机构承担60%的工作量。

秒速攻破朋友圈谣言!达摩院造出AI“谣言粉碎机”

在此之前,达摩院NLP团队曾在机器阅读理解顶级赛事SQuAD上,凭借82.440的精准率打破了历史纪录;在国际顶级机器翻译大赛WMT上,连夺英文—中文翻译、英文—俄语互译、英文—土耳其语互译5项第一。

在互联网时代,从海量信息中即时快速地获取信息成为每个人的基本诉求。让AI成为人类大脑的延伸、读懂人类的语言,对抗人们爱让“谣言传千里”的“本性”,建立起更高效的语言与数据传播路径,达摩院的科学家们一直在不断刷新着世界纪录,攻克下一座又一座全球技术的高地。

相关推荐

码农的小得小感 / 0评论 2019-11-01