AI创作了史上第一部小说,读完之后我懵了

AIBigDataWH 2018-11-09

AI创作了史上第一部小说,读完之后我懵了

英文原文:The First Novel Written by AI Is Here—and It’s as Weird as You’d Expect It to Be

小说家 Ross Goodwin 效仿大文豪 Jack Kerouac 进行了一次横穿美国的公路旅行,并创作了小说《The Road》,但主笔并不是他本人,而是 AI。结果却并不是非常令人满意,Goodwin 表示,AI 要写出人类水准的小说,还有很长的路要走。

去年,一位小说家进行了一次横穿美国的公路旅行。这次旅行是为了效仿 Jack Kerouac——在旅途中寻找一些重要的东西,并写下了自己的经历。

Jack Kerouac 在 1948-1950 年横穿美国,最后到达墨西哥城,并创作了《在路上》。

然而,这位作家与寻常作家非常不同——它只是一个麦克风,一个 GPS,一个摄像头和一台笔记本电脑。

许多认为人工智能和机器学习不会让人类失业的人很乐观的表示,人类的创造力是难以模仿的。一个非常经典的观点是:就像机器将我们从重复性的手工任务中解放出来一样,机器学习将使我们从重复性的智力任务中解放出来。

这就能让我们在工作的同时,有更多自由的时间去追求自己的爱好,与亲人共度美好时光。

但回过头来想想,创造力,是人类基本的能力吗?还是说,机器学习也可以做到?

如果它们能做到比我们更了解自己,那么 AI 写出来的小说将会是你读过最好的小说吗?

AI 创作的小说可能不会是一本“沙滩读物”

当然,这是未来主义者的观点。就像 Ross Goodwin 的凯迪拉克在那次公路旅行中临时装配的装置所证明的那样,现实离我们还有一段距离。

Ross Goodwin 在谈及他机器创作的小说时说道:“这是一个非常不完美的文档,只是一个快速原型项目。输出并不完美。我不认为这是一部人类小说,或任何类似小说的东西。”目前,这本由 AI 首次创作的读物《The Road》正在推向市场。

一旦训练好神经网络,它就能产生作者想要的任意长度的文本(无论是随机的还是从特定的种子单词(seed word)或短语中产生的)。Goodwin 利用公路旅行的景象和声音提供了这些种子:小说是根据图像、地点、麦克风的对话,甚至电脑内部的时钟来完成的,一次只写一个句子。

结果,喜忧参半。

小说用一种恰如其分的方法完成了开头的内容,引用了时间概念:“早上九点十七分,房子很重(It was nine seventeen in the morning, and the house was heavy.)。”根据输入到算法中的 Foursquare 数据集,AI 开始对地点进行描述开,但很快就与主题产生了偏离,变得超现实主义起来。虽然文学实验是一件美妙的事情,但重复地引用经纬度坐标不太可能赢得“布克奖”。

输入数据,输出艺术?

神经网络作为创造性的智能体具有一些优势。他们擅长在大型数据集中进行训练,识别这些数据集中的模式,并产生遵循相同规则的输出。由 AI 启发或创作的音乐已经成为日益增长的音乐创作形式,目前甚至还有一张人机合作创作的流行音乐专辑——《Songularity》。

神经网络可以在数小时内“听”所有巴赫和莫扎特的音乐,还可以让自己再莎士比亚的作品中进行训练和学习,从而创作出还算“凑合”的作品。人工创造的想法已经变得如此普遍,以至于目前甚至还有人将神经网络“机器人”强行训练到人类的文字样本上,结果却是令人捧腹。

从纽约漫游到新奥尔良的 AI 是 LSTM(长期短期记忆)神经网络。 默认情况下,保留单个神经元中所包含的信息,并且只能在单个时间步长中“忘记”或“学习”一小部分,而不是完全覆盖神经元。

在手写和语音识别等任务中,LSTM 架构比以前的递归神经网络表现更好。神经网络及其编程人员进一步研究了文学的影响,根据 Goodwin 的理论,他们吸收了 6000 万字(360 兆字节)的原始文学作品,其中,三分之一是诗歌、三分之一是科幻小说,最后的三分之一是“黯淡”文学。

通过这种方式,Goodwin 对项目有了一些创造性的控制;源材料影响机器的词汇和句子结构,从而影响作品的基调。

文字背后的思想

人工智能小说家的问题与计算机科学家从图灵时代就一直试图解决的会话人工智能问题是一样的。机器能比人类更好地理解和再现复杂的模式,但它们不知道这些模式意味着什么。

Goodwin 的神经网络在一台连接笔记本电脑的微型打印机上,一次只能打出句子中的一个字母。神经网络追踪到的统计关联可以由字母组成单词,也可以由单词组成句子,但它们对字符或情节一无所知。

在与聊天机器人交谈时,代码并没有真正理解之前所说的内容,并且没有足够大的数据集可以通过所有数十亿次可能的对话来训练它。

除非限于一组预定的选项,否则它会在一两个回复后丢失对话的主题。同样地,创造性的神经网络没有真正的把握他们所写的东西,也没有办法产生任何整体连贯或叙事的东西。

Goodwin 的实验通过不断地在摄像机或微信的刺激(神经网络所驱动的美国景观提供的主题链接和叙述),给人工智能的“小说”增加一些连贯的主线。Goodwin 觉得这种方式借用了旅途本身的连续性和连贯性。

AI 并不能取代人类写出高水准小说

一个连贯的语气和语义“风格”可能足以产生一些模糊却令人信服的青少年诗歌,就像谷歌所做的那样,使用神经网络的实验小说可能会产生一些有趣的结果。但涉猎这个时代超现实的人工智能散文,并寻找一些超越新奇价值的意义或主题,可能是一种令人沮丧的经历。

相关推荐