欢迎您访问武汉大学《写作》杂志/中国写作学会网!
写作论坛
首页/ 写作论坛/ 正文
杨逸云,宋时磊 | 人工智能写作的历史回顾、概念界定及研究展望
发布时间:2024-09-25 08:31:17 来源: 访问次数:

作者简介:杨逸云,武汉大学文学院博士研究生;宋时磊,文学博士,武汉大学汉语写作研究中心研究员,文学院副教授,中国写作学会副秘书长。


《人工智能写作的历史回顾、概念界定及研究展望》原载于《湖北社会科学》2024年第4期第38—46页(点击查看微信推送)。



人工智能写作虽经历了从理性主义到经验主义的范式转变,但始终具有以下三种特质:首先,写作过程由人机共同合作完成,计算机是人工智能写作的显性作者;其次,其基础是语言模型,理性主义范式采用基于语法规则的模型,经验主义范式则采用基于统计的语言模型和基于神经网络的语言模型;最后,人工智能通过计算写作生成自然语言文本。这三种特质彰显了人工智能写作的实质,即计算机以语言模型生成自然语言文本的过程。基于现有学术成果,研究者可在进一步明确研究边界、拓宽研究视野、改进研究方法等方面着力,促进人工智能写作的理论发展。



人工智能写作是人工智能(Artificial IntelligenceAI)技术的应用之一。近年来,人工智能已写出了不少引人注目的作品,如微软“小冰”的《阳光失了玻璃窗》,“快笔小新”、Dreamwriter等生成的新闻报道等等。自2022年始,国内外又推出ChatGPTkimi、文心一言等基于大语言模型的写作工具,人工智能写作迅速成为亿万民众瞩目的对象和全球学界讨论的焦点。人工智能写作勇立21世纪信息技术的潮头,携手人文艺术,成为沟通“两种文化”的桥梁。在人文社科领域,学界已广泛探讨了与人工智能写作相关的诸多理论问题,包括写作主体、技术生成机制以及审美创造等。不过,关于如何认识人工智能写作的本质,怎样理解人工智能写作科学实验与人文实验的双重属性,并在跨学科视域下找寻有利于观察人工智能写作现象的立场、获得沟通科技与人文的交互性视角等问题,学界还未取得广泛共识。本文拟从理性主义与经验主义两种自然语言处理研究范式出发,回溯人工智能写作历史,尝试界定人工智能写作的概念,展望人工智能写作研究的发展前景。

一、历史回顾




1956年,约翰·麦卡锡(John McCarthy)在达特茅斯会议上,首次提出了人工智能的概念。而人工智能写作实践却可追溯至1952年,当时英国计算机学者克里斯托弗·斯特雷奇(Christopher Strachey)用计算机程序生成文本,拉开了人工智能写作的序幕。人工智能写作深受理性主义和经验主义两种研究范式的影响,理性主义方法以阿夫拉姆·诺姆·乔姆斯基(Avram Noam Chomsky)的语法理论为基础,又称基于规则的方法(rule-based approach),即通过专家编制规则,构造相应的写作程序,旨在通过手工编码大量的先验知识和推理机制,复制人类大脑中的语言能力。但是,理性主义方法面临着知识瓶颈,有关研究进展缓慢,于是经验主义方法随之兴起。经验主义方法以香农(Claude Shannon)的信息论为理论基础,又称基于统计的方法(statistic-based approach),主张通过建立特定的数学模型学习复杂、广泛的语言结构,并很快在机器翻译1、汉语对联写作2等方面取得骄人成绩。

20世纪90年代,基于理性主义方法的人工智能已在诗歌、戏剧、小说等文体写作领域崭露头角。21世纪以来,基于统计和神经网络的经验主义方法后来居上,并在人工智能写作方面不断推出令人震惊的学术成果。总体来看,国内人工智能写作的实践虽起步较晚,但自20世纪80年代开始,其进程基本与国外同步。

(一)理性主义范式下的人工智能写作

20世纪八九十年代,国内人工智能写作实践主要在诗歌领域展开。1984年,上海育才中学的梁建章设计了一款诗词创作软件,获得首届青少年计算机程序设计竞赛初中组四等奖,这是我国最早的人工智能写作实例。梁建章设计的诗词创作软件,平均不到30秒即可创作一首五言绝句。为设计这一软件,他学习了《唐诗三百首》《千家诗新注》《学诗百法》,根据语法句式结构、对偶、韵律等设计出诗歌写作规则,再将500多个诗词常用词汇纳入计算机数据库。与梁建章的软件不同,1989年刘慈欣设计的“电子诗人”专产现代诗歌。它用VF编程,含5个程序模块、6个词库、1个语法库,产诗量为每秒200行(不押韵)或每秒150行(押韵),产诗的方式绝对全自动,除了告知行数外,不需任何人为干预。3刘慈欣认为现代诗歌讲究朦胧和自由,没有绝对的标准,因此现代诗歌的生成也不需要严格的专家知识。程序员猎户与刘慈欣持同样看法,他认为现代诗歌的规律是主谓宾的“乱搭配”及形容词、名词、动词的“乱搭配”,并据此开发出“猎户星”免费在线写诗软件。工程师张小红则对现代诗歌的生成有着不同看法,1994年,他开发出智能写作软件“GS文章自动生成系统”,并把软件生成的作品结集为《心诉无语——计算机诗歌》和《中国机器诗》,其中《中国机器诗》以电子形式出版,获得国家版权局计算机软件著作权。张小红的写作软件采用“诗歌坐标构思法”生成现代诗,这一方法类似于雅各布森诗歌理论中的对等原则,即将诗歌中的词语分别对应到坐标轴,x轴为组合轴、y轴为选择轴,将x轴与y轴上的信息进行强化联结,就生成了诗歌。与此相似的还有林鸿程(稻香老农)开发的古典诗歌智能写作软件“电脑作诗机”、“大作家”自动写作软件等等。

人工智能的写作实践,引发了学界关注。对于这个崭新事物,学者们采用了多种不同的指称方式,例如“计算机辅助写作系统”“智能辅助写作”“电脑自动写作”“机器智能写作”等等。值得指出的是,当时学界并未将其作为独立的研究对象,而是普遍认为人工智能写作是电脑写作的高级发展阶段。




(二)经验主义范式下的人工智能写作

21世纪以来,基于经验主义的人工智能诗歌写作实践令人瞩目。这类写作程序均建立了数据集,通过学习和分析其中的诗歌,搭建写诗模型。当用户输入诗歌题目时,模型便会通过概率计算出与该题目相关的字词,组合成最终的诗歌。如微软“小冰”学习了1920年以来519位中国诗人的现代诗,通过不断训练拥有了写作现代诗的能力,并于2017年出版了首部由人工智能写作的诗集《阳光失了玻璃窗》。同年,清华大学开发的人工智能诗歌写作软件“九歌”登上中央电视台科技类挑战节目《机智过人》,与青年诗人比拼诗词创作,并成功通过现场图灵测试。2019年,封面团队的“小封”通过学习数百位诗人的诗歌,来创作现代诗和古体诗,出版了诗集《万物都相爱》。京东、百度等网络平台也开发了相应的诗歌写作软件。目前,网络上较为活跃的人工智能写作平台还包括“诗三百”、华为“乐府”等。

同一时期,人工智能新闻写作也取得了较大成功。国内机器新闻写作在20152019年出现一个小高峰,媒体纷纷开发了自己的写作机器人。2015年,腾讯新闻上线了写作机器人Dreamwriter,它从国家统计局网站中获取数据,并选择一些高级统计师的评论建议,仅用一分钟就完成了国内第一条由机器写作的稿件《8CPI同比上涨2.0%,创12个月新高》。同年,新华社使用“快笔小新”为体育部、经济信息部等部门和《中国证券报》等报刊提供财经、体育类新闻稿件。2016年,中国地震台网在四川发生地震的几分钟后就使用写稿机器人发布了新闻。同年,今日头条的“张小明”在奥运会报道中也崭露头角,它主要从文字直播数据中进行语句筛选与融合,进而生成赛事报道。随后几年间,《南方都市报》《封面传媒》《厦门日报》、百家号等媒体纷纷使用写作机器人批量生成新闻。

在小说领域,陈楸帆使用自主研发的人工智能写作程序“AI 科幻世界”完成了人机交互写作《恐惧机器》《出神状态》等短篇科幻小说,并发起了首次华语科幻AI人机共创写作实验项目“共生纪”。华东师范大学王峰团队采用“国内大语言模型+提示词工程+人工后期润色”的方式发布了超过100万字的人机融合式长篇小说《天命使徒》。此外,经验主义范式还催生了不少辅助写作软件和平台,如“笔神”“彩云小梦”“WPS智能写作”“法律文书智能辅助”“在线剧本智能写作”等,为写作者提供了数据库联想、续写等功能,只要使用者输入相关文字,平台便会推送关联文本信息,以供参考。

2022年,OpenAI推出的ChatGPT可以按照人类提示自主完成诗歌、小说、新闻、学术论文等各种文体的写作,通用人工智能不再遥不可及。随着技术进步,基于经验主义的人工智能写作质量大幅提升,相关研究课题数量也显著增长。在诸多研究中,不仅有针对写作基础问题的研究,如人工智能写作的主体、原理、文本形态、读者接受情况等;还有针对不同文体写作的研究,如对人工智能诗歌、人工智能小说、机器新闻等的专题讨论。然而,有关人工智能写作概念的研究几近缺位。从理性主义到经验主义,人工智能写作已经积累了足够的研究样本,进行概念界定的条件早已具备,但多数研究忽略了这一基础问题,转而直接投入具体理论研究中。厘清概念是开展系统理论研究的基础,只有通过明确的定义,才能深入探讨人工智能写作的本质、挑战及应对措施,推动相关研究向前迈进。ChatGPT等大语言模型的火爆出圈使人工智能写作现象再次成为各界焦点,人文学者如何充分吸收自然科学的研究成果,从跨学科的角度理解并界定人工智能写作的概念,成为21世纪中国写作研究的当务之急。

二、概念界定




人工智能写作是计算机科学自然语言处理技术的应用之一,人文社会科学界则倾向于将人工智能写作理解为新技术词汇“人工智能”与旧艺术概念“写作”的叠加,该如何界定人工智能写作概念?笔者认为,首先要考虑人工智能写作的特殊性,避免简单类比人类写作概念的倾向;其次要充分考虑人工智能发展的技术路径,尽量从技术与艺术的交互角度切入。基于这两点,笔者将从谁在写、怎么写、所写为何这三个维度探究人工智能写作概念的内涵。

(一)谁在写?——计算机

谈到人工智能写作,首先遇到的问题就是谁在写?是人还是机器?对此,学界多从主体性角度予以讨论,如,张强等认为主体性是人独有的,只认可人的作者地位;又如,刘欣、毕日生等、周建琼则将当前的人工智能写作主体视为一种人机间性主体。人工智能写作由人机合作完成,人类的参与主要体现在前期人工智能写作程序的开发及后期对写作结果的删选中,而人工智能生成文本的整个过程都由计算机在“中文屋”中完成,并不需要人类直接干预。因此,笔者认为有必要强调计算机的显性作者地位。近两年GPT模型的发明与运用更加凸显了人工智能写作这种自在自为的性质。

计算是人工智能写作与人类写作最根本的区别。人类写作由人脑构思成文,而人工智能写作则是计算机通过计算完成的。人工智能将自然语言转换成数值,通过计算得出结果,然后再转换回文本形态。诚如美国硅谷人工智能研究院院长皮埃罗·斯加鲁菲(Piero Scaruffi)所言:“到目前为止,无论何时人工智能解决了一个问题(例如,在围棋比赛中战胜人类大师),人们都会发现这种解决方法并没有任何特别之处,只是在高速计算机上进行了非常复杂的数学运算罢了。”在以往的人工智能写作研究中,学者往往选择重视计算的方法,将人工智能写作定性为程序写作或算法写作,而忽略了实施计算的主体——计算机。虽然人工智能写作程序承载着人脑的思想,是实现人工智能写作的灵魂,但如若没有计算机这一平台,再好的程序也无法发挥作用。

作为计算的主体,计算机在人工智能写作中扮演着十分重要的角色,它为程序和算法的实现提供了硬件和软件环境,使人工智能能够处理大量的数据、完成复杂的任务。当前人工智能写作对计算机运算能力的要求越来越高,例如谷歌在2018年开发的用于人工智能写作的BERT语言模型只有3.4亿模型参数量,而到了2020年,由OpenAI 公司开发的GPT-3语言模型已超过了1750亿个参数量。目前,人工智能写作正处于以计算能力换取写作效果的阶段,创造庞大的模型似乎成为人工智能写作不可逆转的趋势,计算机的计算能力也直接决定了经验主义范式下人工智能写作未来发展的可能。

(二)怎么写?——建立语言模型

语言模型是人工智能写作实现的具体方法。在人工智能写作过程中,计算机难以直接处理复杂的自然语言,因此需要将自然语言用数学方法形式化,建立语言的形式模型,简称语言模型。语言模型的发展经历了从理性主义方法到经验主义方法的转变。在人工智能写作发展初期,理性主义通过归纳语言规则来实现语言的表示和推理,虽然在特定领域取得了成功,但其在处理人类语言的复杂性方面存在局限。随着大规模语料库的出现,经验主义逐渐在发展中占据主导地位,并在处理大规模文本数据方面成绩显著,ChatGPT等大型语言模型便是其代表。

1.理性主义范式语言模型

“情书生成器”是理性主义范式语言模型的代表性实践。1952年,克里斯托弗在第一台商用通用计算机“马克1号”(Ferranti Mark I)上开发了“情书生成器”,专门用于情书写作。克里斯托弗想让计算机模仿人类思维生成多样化的成果,于是自制了一套情书写作规则,并将这些规则转换为计算机指令。首先,他从罗杰英语同义词词库中选择了70个左右的基本词汇,然后根据语法规则编制出了五句话的情书生成模型。他主要设计了两种句型,一种是“我的<形容词><名词><副词><动词>”,另一种是“你是我的<形容词><名词>”。生成器可以随机选择使用哪种类型的句子,但如果有两个连续第二种类型的句子,则第一句以冒号结尾,第二句前面的“你是我的”被省略。整封情书一共有五句话,最后以“你的<副词> M. U. C.”结尾。句型确定后,再将对应词性的词语随机填充到规则当中,便可产生一封情书,如下所示:
亲爱的甜心
你是我的狂热伙伴。我的感情奇怪地紧紧抓住你的热情愿望。我喜欢你的心。你是我渴望的同情:我温柔的喜欢。
你美丽的 M. U. C.
克里斯托弗的这一尝试,开启了人工智能写作的先河。上文所述梁建章、刘慈欣、张小红等人发明的文本生成软件均使用这种写作方法。

2.经验主义范式语言模型

与理性主义不同,经验主义认为大脑并没有先天的语言知识,语言知识是基于经验发展而来的,完成自然语言处理任务不一定要经过“理解”的阶段。经验主义研究范式将人工智能写作视为概率求解问题,通过概率确定自然语言出现的可能性,概率越大,句子的合理性越充分。经验主义范式下的人工智能可以在大规模文本数据上进行训练,生成的内容质量相对较高,由于其底层逻辑为概率统计,被姜峰楠(Ted Chiang)等学者称为“应用统计学”。

1)基于统计的语言模型

经验主义最初采用的是基于统计的语言模型(statistics-based language model)。这种模型通常依赖于数据集,通过分析数据集中的文本数据来计算单词序列出现的概率。假设给定一个语料库词典V,所有的单词w都是词典V当中的,wiV。统计语言模型计算的就是任意单词序列合理的概率p(w1,w2,,wn),其中,p0。假设训练集中共有N个句子,接下来数一下单词序列(w1,w2,,wn)出现的次数n,即可得出概率p(w1,w2,,wn) =[nN]。但是,一旦这个单词序列(w1,w2,,wn)没有在训练集中出现过,模型的输出概率就会变成0。为了解决这一问题,人工智能研究者采用了概率论中的链式法则,将长句子的概率分解为多个简单部分的乘积,并假设每个词的出现概率仅与它前面的词相关。通过这种方式,计算机可以逐步计算每个词的条件概率,并将它们相乘得到整个句子的概率,即p(w1,w2,,wn) p(w1)p(w2|w1)p(w3|w2)p(wi|wi-1),这就是二元语法模型(Bigram Model),同理可推广至三元语法模型(Trigram Model)、N元语法模型(N-gram Model)。

由于统计语言模型学习能力有限,需要学习的词组太多,如果训练集中缺少某些词组,这些未出现的词组将导致计算出的概率值为零。即使采取平滑技术解决,将所有词组出现的次数加1,仍会出现诸如维度灾难2的问题,于是基于神经网络的语言模型(neural-network-based language model3应运而生。

2)基于神经网络的语言模型

神经网络语言模型的基础仍然是概率计算,但它使用词向量表示单词或单词组合,并在此基础上通过神经网络表示语言模型,提高了语言表达效率,成为当前人工智能写作使用的主流方法。

首先,神经网络语言模型提出词向量的概念,采用具有一定维度的实数向量表示单词的分布式,以此代替统计语言模型中使用的离散变量,解决了维度灾难问题。其次,神经网络语言模型用神经网络建模语言,对于从来没见过的单词搭配也能通过词向量拟合出对应的概率,避免了零概率问题。神经网络是一种模仿人脑神经元连接方式的计算模型,它由许多相互连接的神经元组成,每个神经元都与其他神经元相连,并通过这些连接传递信息。2003年,约书亚·本吉奥提出第一个前馈神经网络语言模型(FFNNLM),该模型先在输入层输入词向量,然后通过隐藏层对词向量进行加权和转换,最后由输出层给出可能出现的单词的概率。在训练过程中,神经网络会调整连接权重,以便更准确地预测单词序列。之后,为了更好地捕捉和分析单词序列特征的信息,其他学者又提出了循环神经网络模型(RNN)、长短期记忆模型(LSTM)、序列到序列模型(Seq2Seq)等等。目前,人工智能写作最先进的神经网络语言模型为双向编码器表示模型(BERT)和生成式预训练模型(GPT)。

对于人工智能而言,建立语言的形式化模型,并使之能以一定的数学形式严密规整地表示出来是最有困难和挑战性的一步,因此,语言模型直接决定了人工智能写作的质量。目前,理性主义和经验主义方法下的语言模型各有优势,在不同文体写作领域都取得了一定成绩。

(三)写的是什么?——自然语言文本

人工智能写作的文稿可以称为“作品”吗?由于涉及知识产权,法学界重点关注了这一问题,并形成两种鲜明的观点。文学界的多数学者则仍然使用传统的“作品”一词来指代人工智能生成的内容。笔者认为,人工智能写作与人类写作存在本质差异,为凸显二者区别,建议将人工智能写作的文稿称作“自然语言文本”。

人工智能通过数据、算法、算力完成写作任务,其本质是计算写作,并不具有主观精神与意识。人类写作由“心”生发,与人工智能依靠的“机芯”有着根本区别。下文以“云松”主题为例比较人工智能生成的诗歌文本与人类诗歌的差异。
云松
銮仙玉骨寒,松虬雪友繁。
大千收眼底,斯调不同凡。
这首《云松》由前述梁建章设计的诗词创作软件生成,属于理性主义范式下的人工智能写作。该诗夸赞了云松的高大耸立及其不同凡响的气质,文字看似对偶工整,实则缺乏内在逻辑,如“松虬雪友繁”一句,松树盘曲的枝干与“雪友繁”之间似乎并无联系。

在“诗三百”平台中输入古诗主题“云松”,选择五言绝句,即可快速得到下面这首基于经验主义范式的文本:
云松
白鹤舞清秋,云松共偃休。
何时归去此,长伴赤松游。
该平台拥有较大的古诗数据库,当用户输入诗歌主题后,平台通过概率计算推测出首联的首字“白”,然后利用“白”和语义向量继续推测出第二个字“鹤”,再根据“鹤”和语义向量推测出第三个字“舞”以此类推,直到预测出终止符。这首《云松》前两句描述了一只在深秋起舞的白鹤站在云松旁休息的情景;后两句追问白鹤何时回到仙人身边,陪伴仙人游历。虽说题目为“云松”,但诗歌内容并未围绕云松展开。可见,人工智能生成的诗歌内容与题目的关系并不紧密,似未达到诗歌写作的基本标准。

同样是描写松树,李白的《南轩松》以其超凡脱俗的意境和深邃的情感,将松树的高洁品质与诗人的志趣相融合,展现了一幅生动而富有哲理的画面。从写作技巧上看,既展现出清晰的逻辑层次,又对词句进行了精心雕琢。诗歌的首联即破题,颔联和颈联写景,尾联借孤松寄托诗人高远洒脱的情怀。
南轩松
南轩有孤松,柯叶自绵幂。
清风无闲时,潇洒终日夕。
阴生古苔绿,色染秋烟碧。
何当凌云霄,直上数千尺。

比较三种文本,就可以发现人工智能写作与人类写作之间的差异。首先,从作诗动机看,人工智能只是在完成一项以“云松”为主题的写作任务,并不理解自己的操作有何意义;而人类的写作则是“情动于中而形于言”,是李白在观察到南窗外的松树时产生了感悟,继而运思和行文。一个是“要我写”,动力来源于外部;一个是“我要写”,有强烈的内在动机。其次,从作诗过程看,人类的写作受到作者性格、阅历及文化环境影响,李白写作《南轩松》时正栖止于安陆,虽隐居山中,但仍在寻求复出时机,因而写出“何当凌云霄,直上数千尺”的诗句,以孤松自喻,表达出对未来的期盼;而人工智能写作的诗歌主要受数据库和算法制约,在“诗三百”版本的《云松》中,“何时”“归去”“长伴赤松游”等都可在先前的诗歌中找到原型。可以说,人工智能写作并非严格意义上的原创,不具有人类写作的创造性,只是一种制作。如果严格对标人类写作的概念,人工智能写作就成为了一个不言自明、不攻自破的伪命题。因此,人工智能写作的结果更适合称为“自然语言文本”。

笔者提出“自然语言文本”的概念,还有以下两方面的考虑。其一,文本是作品的存在形态,它与作品的关系可以用一个短语来说明——某某作品的文本。文本是低级的,同时也是基础的,它可以是一句话、一个段落或一个篇章;而作品则是高级的,往往蕴含了丰富的精神价值。当前人工智能生成的文稿并非都能达到作品的水平,文本的用法显然更加贴切。其二,从技术层面上看,文本生成本身就是自然语言处理中的一个重要研究领域,它曾被认为是人工智能写作的学术性说法。但仅仅使用文本来代替作品,仍容易产生歧义,因为计算机领域中的文本除了指主流意义上的语言文字外,还包括代码等其他编码化的电子信号。因此,有必要在文本前面加上自然语言的限定,使表述更加精确。

通过探究谁在写、怎么写、所写为何等写作学基本问题,笔者认为,人工智能写作的实质是计算机以语言模型生成自然语言文本的过程。基于人工智能技术来对人工智能写作进行概念界定,更符合人工智能写作的本质,且有利于确立观察人工智能写作现象的稳定立场,进一步深化人工智能写作的研究。

三、研究展望




人工智能写作及其研究既受技术迅猛发展的影响,也与人文社科多学科交叉互动,处于科技与人文交汇的前沿。当前,人工智能写作及其研究仍处于起步阶段,概念界定仅仅是人工智能写作系统性理论研究的第一步。在厘清概念的基础上,还需要明确人工智能写作的研究对象;开阔研究视野,警惕仅仅研究某种人工智能写作范式的倾向;同时注意研究过程中跨学科方法的运用,避免从单一的人文或科学角度开展研究。

(一)明确研究对象:厘清人工智能写作研究的边界

一直以来,人工智能写作都没有一个明确统一的概念,相关研究的边界不甚清晰。在以往研究中,人工智能写作或被理解为一种技术,或被当作一种写作现象。如若将其看成一种技术,那么,只有计算机以语言模型生成的自然语言文本才属于人工智能写作,与此相关的事物皆为人工智能写作研究的对象。基于此原则,需要指出以下两点注意事项:第一,不应将所有自称为人工智能写作的软件或平台都纳入研究范围。由于人工智能已成为时尚的标志性用词,市面上一些伪原创软件也想搭乘人工智能的快车获取商业利益,但这些软件只能对写作素材进行同义替换或顺序调整,并不符合人工智能写作的定义,不能作为人工智能写作研究的对象。第二,一些符合人工智能写作概念但并未以此命名的机器写作现象应当纳入研究。例如生成式聊天机器人经常被学者忽略,但它的工作原理其实与人工智能写作的原理相同。聊天机器人有两种类别,一种是检索式,一种是生成式。检索式聊天机器人有明确的问答数据库,使用语句匹配的形式查找答案,并不涉及文本生成;而生成式聊天机器人是在大量的语料训练基础之上,利用语言模型生成回答文本的,故也应该纳入人工智能写作研究的范围。

倘若将人工智能写作视为一种写作现象,那么,应该明确写作研究本身的范围,而不能随意扩大或缩小。写作基础理论中的写作主体、客体、受体和载体,都是可研究的对象;文体写作中的审美性文体、析理性文体及应用性文体也都属于可研究的领域,包括人工智能诗歌、人工智能小说等等。在机器新闻写作的文体研究中,部分学者默认机器新闻写作包含了写作本身以外的新闻分发及传播等环节,这就扩大了研究对象的范围。在文学写作研究当中,有些学者又缩小了研究对象的范围,将人工智能写作仅仅定义为一种文学生产,但事实上,人工智能写作不仅包括文学写作,还涵盖了非文学写作。

(二)开阔研究视野:以全面的眼光看待人工智能写作

当下,大语言模型在人工智能写作中取得了显著成绩,但不能仅将研究视野局限于此,而应认识到技术是不断演进的,未来的“钟摆”也许还要回归至理性主义,理性主义范式下的文本同样具有重要研究价值。

一方面,对比基于理性主义和经验主义方法生成的文本,可以深入揭示人工智能在特定文体写作中的发展趋势和独特属性。例如在新闻文体写作领域,随着技术方法的转变,机器新闻写作的发展并未日趋向上,而是面临着趋冷的状况。理性主义方法指导下的新闻写作,往往可以以秒级的速度生成新闻,文稿质量虽然一般,但符合新闻的基本原则;而经验主义方法下生成的新闻如若未经人工审核,十分容易违反新闻写作的原则。2023年由ChatGPT生成的一则杭州限号假新闻在网络上广泛传播,引起了较大反响,该新闻的结构与内容并无明显错误,却违背了新闻的真实性原则,因此在ChatGPT被各个行业争相使用之时,新闻行业并未表现出过多的热情。因此,未来是否应使用理性主义与经验主义结合的方法来生成新闻以及假新闻传播所造成的系列衍生问题,特别是安全治理问题都可成为学界讨论的重点问题。

另一方面,将基于理性主义与经验主义方法生成的文本进行文体间的分析,有助于进一步深入理解各种文体的特点及其与人工智能的独特关系。例如,ChatGPT一经出现,学术教育领域便面临着巨大的冲击和变革,一些学生使用其完成学术论文写作,这说明基于经验主义的人工智能在学术论文写作领域取得了较好成绩。对比来看,学术论文与新闻两种文体在人工智能写作的应用发展过程中呈现出了不同的效果,而两者的差异具体体现在哪些方面,为什么会存在这些差异等也是未来人工智能写作研究者需要关注的问题。

(三)更新研究方法:促进技术和人文的对话与合作

人工智能写作是科技与人文的结合。学界对人工智能写作的研究,不仅应立足于科学原理探讨和技术层面分析,而且还要重视人文学科的基础理论,通过人文学科的视角审视人工智能写作的技术挑战,为科技进步提供富有启发性的建议,实现人文研究对技术的反哺。

首先,从技术角度考察人工智能写作的基本原理,研究者能更清晰地理解人工智能写作的底层逻辑。学界对人工智能写作的研究,存在一些人类中心主义的预设立场,对从技术视角提出的相关问题重视不够。例如,在探究人工智能写作原理时,学界偏重以人类写作的特点和水平为评价标准,一定程度上忽视了人工智能写作内蕴的创新意义。再如,关于人工智能写作主体的研究,部分学者引入“作者之死”等文学理论观照当前的人工智能写作。然而,先前的理论讨论的是写作主体与作品、读者的关系,而人工智能写作主体首要关注的却是一种写作主体与另一种写作主体间的关系。如果从技术角度出发,可以把人工智能写作的主体问题转换为人机交互的技术考察。

其次,人工智能写作是人类写作的镜像,人文研究者同样可以从文学艺术角度对技术的开发和改善提出合理建议。例如赵汀阳在研究大语言模型时,大胆假设如果有一种“动词逻辑”可被用来分析事件和问题的生成关系与客观结构,就能够与分析真值关系的“名词逻辑”(即现代形式逻辑)形成配合,从而帮助我们更为充分地理解意识和语言,理解语言何以成为自身的自我解释系统。如果人工智能学会了动词逻辑,或许就能够发展出自我意识从而成为真正的主体。未来,如果人文研究者能从语言学和写作学的角度提出更多设想,也许会反向促进人工智能写作技术的发展,在真正意义上实现科技与人文的结合。

四、结语




人工智能已开启自动写作的时代,由此引发的划时代革命将写作理论提升到了全新高度,传统以人类为中心的写作研究范式已无法充分解释由此引发的新写作现象。面对人工智能写作带来的新问题,从技术原理出发对其展开全面剖析,进行明确的概念界定,便成为研究的首要任务。人工智能写作经历了从理性主义到经验主义的范式转变,写作水平逐步提升,不少人工智能专家认为人工智能已经出现了智能“涌现”1能力。但实际上,当前以ChatGPT为代表的人工智能写作本质上仍然是计算写作,计算机是通过编程展现人类智能水平的,还未实现从制造到创造的飞跃。只有进入强人工智能时代,人工智能才会发生质的改变。届时,“机器人成立作家协会”便会成为现实,当前的概念界定及系列研究也将同步更新。总之,科技同人文的跨学科融合研究已是大势所趋,如何在研究中既充分考虑到技术的本质及发展方向,又保持人文学者的特质,是每一位人工智能写作研究者都应思考的问题。只有在理论和实践中不断探索人类写作的优势,时刻保持居安思危的忧患意识,才能更好地应对人工智能时代写作学面临的挑战。

因微信格式限制,注释及参考文献从略。

本公众号部分图片来自网络,请作者速与本刊编辑部联系,以便署名并奉寄稿酬。

图片

END


排        版:贾晓林

审        核:王    京



武汉大学《写作》杂志社、中国写作学会

地址:湖北省武汉市武昌区武汉大学文学院609 邮编:430072 电话(传真):027-68752268 E-mail:writing@whu.edu.cn

《写作》杂志微信公众号

《写作》杂志订购二维码

Copyright武汉大学2019     鄂ICP备05003330鄂公网安备42010602000219 您是第 位访问者