真相:数据正在“入侵”媒体人的专业领域

互联网与你我的世界 2018-02-05

过去几年间,大数据逐渐从一个热门概念落地为可进行商业变现的具体业务。无论是互联网公司还是传统企业,都在迎接数据带来的改变,媒体行业也不例外。

数据“入侵”,重识媒体

随着移动互联网的普及和大数据技术的发展,泰一数据发现数据技术与媒体的关系愈加紧密,在内容素材、创作参考、业务探索等方面,数据技术正在“挤占”媒体人的生存空间,其表现在于数据在数字技术与媒体融合的过程中扮演着越来越多的重要角色。

内容素材

作为内容素材的数据。在今天的技术环境下,媒体信息的表达不再局限于文字,数据作为一种信息组织形式,正在被越来越广泛的用于传递信息。据对媒体人的调查显示,95%媒体从业者认为数据对于新闻创作具有非常重要的作用。数据已不再是数据新闻团队专属的创作素材,对于普通记者来说,使用数据进行报道正在成为一种新闻操作习惯。

真相:数据正在“入侵”媒体人的专业领域

*数据作为内容素材

同时,如果能对数据进行进一步挖掘,通过数据的汇总和分析,个案之间的潜在关系被重新组织,从中也可能挖掘出另外的新闻发现,这是普通采访所无法达到的。通过数据查看热点、利用数据进行新闻线索挖掘逐渐成为常态。

【应用】

2016年,《华盛顿邮报》开发的新闻撰写机器人Heliograf 正式上线。通过使用记者和编辑提前制作的叙事模板,其中包括各种潜在结果的关键词句,比如,“共和党人对众议院的控制权”,“民主党重新控制了众议院”,Heliograf将这些内容与数据交换网站VoteSmart.org中的结构性数据源相联系,并进行数据识别,与模板中的词句匹配、整合,“编写”新闻,同时根据不同的发布平台提供不同版本的报道。

在国内,腾讯财经的机器人Dreamwriter、今日头条的Xiaomingbot等写稿机器人同样能根据算法瞬时输出分析和研判,在第一时间自动生成稿件并送达用户。

创作参考

作为创作参考的数据。移动设备正在成为最重要的媒介载体之一。据中国互联网信息中心(CNNIC)统计,截至2017年6月,中国手机网民规模已达7.24亿,手机上网人群在网民中占比96.3%。基于电子媒介,人的阅读行为已经被广泛而准确地记录,舆论变化和新闻热点变化可以通过数据被更加细致地呈现。阅读量、转发率、二次传播等数据已成为媒体量化传播效果的重要参考指标。

【应用】

社交平台Twitter上,一款叫做ReutresNews Tracer的工具被用来监测随时出现的各类新闻事件、检测社交媒体信息的真实性。其功能亮点是:能够实时监测社交媒体上的新闻;用算法去问记者平时可能会问的问题,倒推新闻的真实性;通过算法和机器学习挑选出哪些是新闻,哪些是广告、谣言或一般性对话,并摘出要点,同时把相同类别的新闻相叠,组成数据;给记者和编辑提供可靠的素材和资源。

真相:数据正在“入侵”媒体人的专业领域

*ReutresNews Tracer

业务探索

作为业务探索的数据。除了素材提供与创作参考,对新闻数据反馈的搜集分析即舆论业务也逐渐成为部分媒体的新业务内容。

截至目前,包括人民日报、新华社、南方报业等在内的国内媒体已经开始发展数据、舆情业务。其中,人民曰报社从2008年开始组建人民网舆情监测室(2017年更名为“人民网舆情数据中心”),南方报业集团于2014年成立南方舆情研究院,新华网网络舆情监测分析中心于2016年开始推出信息超市平台一一新华“云智”。

【应用】

人民网舆情数据中心已拥有个性化、垂直性监测功能的互联网舆情监测系统,该系统基于网络舆情传播规律,及时、全面地监测境内外新闻网站、论坛、报刊、电视、广播和知名博客、微博,并在此基础上进行数据的抓取、挖掘、聚类、分析和研判,以实现网络声誉管理、舆情监测、敏感信息预警、内部风险管理评估、突发事件实时追踪和宣传工作评估考核等功能。

真相:数据正在“入侵”媒体人的专业领域

*人民网舆情数据中心

媒体巨变,进入“智媒时代”

先进的数据技术使全球的媒体生态都处于巨变之中,随着媒体对宏观数据、行业数据、地理数据、舆情数据、读者/用户数据等数据的掌握,使媒体生态在新闻生产系统、新闻分发平台、用户平台、信息终端四个维度的生态均已经发生变化。其中,新闻生产系统的变革首当其冲,得益于未来数据的极大丰富、算法模型的升级及人工智能等创新应用,这些技术将直接推动内容生产由UGC、MGC进入更高的IGC发展阶段。

在UGC(即用户原创生产内容)阶段,微博、微信、豆瓣等各类网站、APP上的任何用户都可以生成原创内容,因此而产生了数量庞大但质量参差不齐的内容数据。随后的MGC(即机器生产内容)阶段,将大数据、计算机算法和人工智能等工具应用于内容生产,产生大量的优质内容,但目前而言,机器写稿的质量及稿件的普适性依旧偏低,它们更适用于突发新闻事实的报道,但其后仍然需要专业的记者、编辑做深度挖掘和扩充。

直到进入IGC(即智能化内容生产)阶段,机器在代替人类完成重复性、规范性写作和客观数据聚合类等工作的基础上,通过语料、素材与数据的搜集处理与高效率加工等完成内容生成工作,内容生产者在此基础上充分发挥人类的演绎、推理和联想能力,从而完成更深层次的内容生产。

随着数据技术“入侵”媒体,未来人机协作的趋势已是必然,媒体的内容生产将更加智能、信息整理的效率更高、创作能力也将显著提升,因此这种“入侵”未尝不是好事。

【关于我们】泰一数据是泰一指尚(股票代码:600070)旗下数据商业服务品牌,依托大数据技术实力及持续的产品创新,帮助客户实现大数据分析与应用,建构数据价值发现和应用创新能力。

相关推荐