长期以来,大型语言模型(LLM)常常被人们认为是“文科生”,能够胜任各种事务性写作,例如撰写周报、邮件,甚至辅助写学术论文和法律文书。这类写作任务通常具有明确的规则和用途,因此 LLM 可以发挥其优势,有效地完成任务。
然而,正是这些高度规则化的写作任务,容不下任何错误。LLM 经常会产生“幻觉”,即与事实不符、凭空捏造内容或不按用户指令输出,这些问题困扰着工程师和用户。
尽管如此,在另一些人眼中,“幻觉”和“生成”其实是相辅相成的,意味着机器也拥有了创造力。
2023 年 10 月,第五届江苏省青年科普科幻作品大赛中,评委们惊讶地发现,获得二等奖的《机忆之地》是一部完全由 AI 生成的短篇小说。
该作品的作者是清华大学数据新闻教授沈阳,他在创作过程中与 AI 进行了六十多轮的对话,甚至连作品的笔名都是 AI 起的。
同样是在 2023 年,GenWorld 与 Hugging Face、真格基金联合举办了两届“中文 AI 微小说大赛”。与沈阳的匿名投稿不同,微小说大赛明确规定参赛者必须使用 AI 进行创作,且不允许对文本进行人工润色和加工,所有修改都必须通过提示语完成。
用 AI 生成整篇作品并非易事,因为 LLM 的“幻觉”不可控,即使使用相同的描述词,每次生成的文本也会有所不同。
许多参赛者来自程序员背景,他们运用了各种奇思妙想的方法进行“创作”,除了写作工具之外,还使用代码和 Excel 来辅助创作,尽可能控制 chatbot 的表现,保证输出质量。
可以说,这些参赛者通过模仿 AI 的写作方式,理解其逻辑,最终实现了强化控制的效果——这似乎有点“以其人之道还治其人之身”的意思。
目前,一个不容忽视的事实是:AI 写作可以很好地完成事务性的写作任务(例如邮件、文书、文案等),但在故事写作方面,仍有很大的局限性。
不久前,一个西班牙团队进行了一项研究,邀请了一位屡获殊荣的西语作家 Patricio Pron 与 GPT 进行标题写作比赛。比赛结果由专业的文学评论家进行评分。
在创意、文学性和风格化方面,职业作家获得了更高的分数。当两者的作品放在一起比较时,差异显而易见。
部分标题摘录
“GPT 写标题的形式基本一致,都是 ‘xx 的 xx’。而作家起标题的形式就完全不同。” 慕明,同样是一位小说家,她与研究中的专家评审持有相同的观点。她分析道,“比如 ‘Don’t tell mom’, 可能是一个类似 ‘小鬼当家’ 的故事。人类作家可以从已有的电影、小说中汲取灵感来取名,人类读者也能理解这种灵感,这是基于作者和读者之间共同的阅读和观影经验。”
慕明从 2016 年开始尝试写科幻小说,2023 年出版了自己的小说集《宛转环》,入选了 2023 年单读书店文学奖,其中选篇《涂色世界》曾获得第 31 届中国科幻银河奖,并于去年改编为短片,收录至由 B 站出品的《明日生存指南》系列剧集中。
在成为作家之前,慕明曾在谷歌和微软从事代码开发工作。她本科毕业于北京大学智能科学系,后来前往宾夕法尼亚大学研究机器学习,最终成为了一名工程师。
慕明
科幻阅读一直是慕明的爱好,包括科普。她对技术的了解,让她比普通人更早接触到 GPT 生成的“文学”。
她回忆起 2017 年,“当时还没有 GPT-3.5,但有一些更早的尝试,比如微软小冰的诗集,还有陈楸帆的《人生算法》中包含了一段由 AI 生成的文章。”
在那个年代,AI 写作还只是一个小圈子里的新鲜事物,是实验品,尽管当时已经取得了一些令职业作家惊叹的成果。
2023 年,慕明的工作开始涉及剧本创作。虽然她已经写了几年小说,但在剧本写作方面毫无经验。于是,她给自己找了一位“同事”——ChatGPT。
最初,慕明也担心 ChatGPT 是否能够胜任。在咨询了影视行业的朋友后,她开始与这位“新同事”合作编写剧本:由她提供核心创意,然后利用提示语让 ChatGPT 进行修改,并反复迭代。
在这个过程中,事务性写作中让人避之不及的“幻觉”,反而让慕明有了意外的收获:在她的小说《铸梦》中,有一段描写人偶在宴会上跳舞的场景,她将这个场景输入 Mid-journey 生成图片,然后反复放大图片,模型给出了出乎意料的“理解”——宴会舞台位于水下,人偶和人隔着一面反光的水面,也如同他们之间相互映照的关系。
这些经历被她称之为“顿悟时刻”。
高层工作,还是人做得比较好
慕明和她的“同事”似乎合作得还不错。2024 年,各个模型不断迭代升级,拥有了更长的上下文空间,对用户的反应也更加敏捷准确。
然而,慕明与 AI 的合作速度却慢了下来。
剧本和短片工作完成后,慕明回归科幻小说写作,将有限的时间花在自己更加珍视的创作类型上。尽管剧本写作也需要“讲故事”,但长篇小说需要截然不同的技能——而目前 AI 还无法胜任。
“开始从事剧本或图片制作等工作时,我认为 AI 是我的导师或领路人。但现在回到写作方面,我清楚地意识到了它的局限性。”
如今,慕明将大型语言模型工具视为一个“搭子”。它们有一定的经验和智慧,但都不多,“最大的作用是能够督促我每天一起工作。”
她认为大型语言模型确实具有抽象和提炼的能力,但在文学性较强作品面前,“这种能力还是比较弱的。”
“让大型语言模型来做阅读总结可能会好一些。例如论文,其格式非常明确,篇幅也不会太长,是结构化的长文本,可以轻松识别出结论、实验方法、数据分析等部分。”
但小说并非结构明确的东西。慕明提到了她使用过的一款名为 sudowrite 的美国辅助写作软件,能够根据用户需求生成段落,“例如,如果需要一个描述,输入相应的 prompt,软件就会生成一个描述。”
Sudowrite 界面
这也是许多 AI 写作助手产品采用的思路:将写作过程拆解成若干步骤,然后由用户提出需求,生成可用于填充的段落。
但这种方法的效果也有限,“我们可以举个极端的例子,比如一部 100 万字的长篇小说,仅将每个场景拆分出来,工作量就已经非常大了。假设这些场景都由 AI 生成,问题会变得更加复杂。”
这种先拆解再填充的做法,某种程度上是一种“拉表格”思路:每一行代表一个需求点,每一列代表一个解决方案。如果需要新的解决方案,就再开一个新的列。
然而,小说并非这样写成的。
“写小说最困难的是整体的结构,这个结构包括情节和人物性格的转变。” 慕明说,“还包括了整个叙事方式的选择、视角等等。这些大框架或高层工作,现在看来还是人做得好。”
难道是因为大型语言模型训练不足?参数不够多?架构不够好?
“Transformer 架构本身存在问题,例如 attention token length 不够长,这是算法本身的局限性。但模型使用的语料也会产生影响。由于大型语言模型使用了大量语料,因此难以评估某个特定语料对其表现的影响程度。”
AI 所不拥有的
归根结底,大型语言模型使用的是一套完全不同的“写作思路”。
慕明从 2016 年开始写小说,她第一阶段的学习是从喜欢的作家入手,观察分析,将研究出的写作技巧和原则应用到自己的创作中。
最初,她深受刘宇昆和特德·姜的影响。“刘宇昆擅长运用 confluence 的技巧,即合流。而特德·姜更善于推演出抽象的概念,他会创作出思辨意味很浓的小说,与传统小说不同,但依然拥有很强的叙事动力。”
后来,慕明的阅读范围越来越广:勒古恩、阿特伍德等作家作品的篇幅足够长,足以构建完整的世界观,同时又建立在一个有故事性的题材之上。
大量阅读后,便是不断地写作,参加比赛,获得反馈,反思,调整。“我会开始思考,我参加的比赛或遇到的读者,是否和我写作时想象的读者一致?或者我的读者是否从我这里获得了他们想要的东西?如果不一样,如何弥补这个差距?是需要找到不同类型的读者?还是需要调整语调或故事的形式?”
慕明学习写作的过程,有明确的阶段划分,不同的阶段有不同的目标任务——换个角度想,AI 也是一个擅长按照计划、逐步实现的思维模式,不是吗?
“AI 在过程划分方面的能力比人类更强,尤其是在给定了框架的情况下。但我想强调一点:就我的个人经验而言,我的意图是明确的。”
慕明指的是 AI 不具备主观能动的意图。这包含两方面:一是作者写作过程中的意图,即写作的成长路线;二是作品本身的意图,即作品的主旨。
“意图” 是美国哲学家丹尼尔·丹尼特提出的概念。德国生物学家维尔纳·西费尔在《叙事本能》中,用这个概念来解释人脑如何使用“意图”来理解自己的生活。另一个重要的概念是“前景化”:在海量的信息中,如何凸显和前置某些特定的信息,实现注意力的引导和信息的排布。
“我知道我喜欢这位作家,所以我将会阅读更多类似的作品;我认为这可能对我的某个创作很有帮助,所以我会去看看更多的例子。对我来说,每个阶段的意图都比较清晰。这可能与大型语言模型不同,意图是人为的、主观的。”
现阶段,基于大型语言模型的写作工具,包括通用型 chatbot 提供的写作辅助服务,都是建立在用户作为主体、bot 作为执行者的基础上。它们不能也不可能拥有自己的意图,更难以实现有侧重地处理信息。
这天然限制了模型在故事创作方面的发挥:那些基于“幻觉”偶尔冒出来的段落和灵感,不足以支撑完成一个有篇幅、有走向的故事。
这导致 AI 写作工具要么是堆砌素材,以无限流的方式生成、叠加、拼接在一起;要么是无序地编织一个故事。那些人类可以轻松感知到的、由情节和角色推动的故事进程,在 AI 看来,只是偶然出现的“幻觉”之笔。
这种组织信息的方式显得过于随意。“在现代小说中,所有素材都需要一种组织方式”,慕明说,“可能不是传统的线性组织。但细节和素材都需要围绕故事的主题或内核服务。”
“文学界有一个著名的说法叫契诃夫之枪:如果你在小说开头写了一把枪,那么它一定是有作用的,后面一定要开出来。在文学中,这种处理信息的能力或倾向,扮演着非常重要的角色。”
契诃夫之枪,原意为:如果在第一幕写了一把枪,在第三幕需要让这把枪开火
故事是生活的一部分
通过小说,慕明想象了一种她心目中的人工智能,与当前基于大型语言模型的人工智能不同。
她更认同神经学家达马西奥提出的心智模型:外部环境刺激情绪,感受将情绪反应带入意识,整合完成后,即时的自我意识生成,长期的经验和记忆会继续整合,从而形成连续的自我意识和身份。
达马西奥代表作《感受与认知》
这是一种相对“老派”的路线,达马西奥的理论依然将情绪和感受作为基点——而这恰恰是文学创作的根基。
“对我来说,当我产生某种感受——比如我觉得一件东西很有意思——我就想写故事,把它更清楚地表达出来,让更多人知道。这是一个写作的动力。”
事实上,许多文学作品往往源于一种明确而强烈的情绪:无力、心碎、愤怒、悲伤等等。
这些情绪并非凭空产生,而是在人们经历过某些事情后被激发出来。反复经历、反复卷入一桩又一桩事件,这就是命运。
余华曾说过,AI 能够表达人类的想法,却无法表达命运的想法。
文学性的写作是一个具有整体性和有机性的过程。它建立在经历和体验之上,由情绪和感受激发,在纷繁复杂的信息中找到最合适的故事作为工具,将所有的一切娓娓道来。
这项工程悄无声息地发生在作者的脑海中,我们最多只能听到键盘敲击的声音,但它本身却浩瀚复杂,遣词造句只是其中一个步骤而已。
慕明最后引用了诺贝尔文学奖得主奥尔加·托卡尔丘克的获奖感言,她相信,每个人都想要弄懂自己的生活,都在“书写”自己的故事:
“即使当我们阅读那些最形式主义的、词句简洁的故事时,我们也不能不问:为什么会这样?这是什么意思?这有什么意义?这会带来什么后果?我们的思维很有可能在不断地解释围绕着我们的百万个刺激时,以一种‘故事’的方式进化了,以至于我们在入睡时,也一直在不停地继续我们的讲述。
所以,故事是一种在时间中编织起无限量信息,打开它们通往过去、现在、未来的通路,把握住它们每一次再现,并将它们安放在因果类别中的一种方式。理智和情感都参与其中。故事最早的发现之一就是命运,这一点不足为奇。命运虽然让我们觉得恐惧和不人性,但它将秩序和稳定带入现实。”