主持人语
4月底的夜晚,一位老师发来消息,问我是否认识某平台的编辑,指出他们刊发的文章可能由DeepSeek生成,并标注了其中不符合史实的地方。在我帮忙联系的时候,他问我,你们有收到运用DeepSeek写作的稿件吗?我陷入沉思,我知道DeepSeek生成的文本可能离我们很近,也自认可以看出文章的“AI感”,但我没有考虑过,如果有人借助它输出了真假混杂的内容,对于研究对象缺乏了解的我们,如何在语词之外,识别孰真孰假呢?
这位老师的问题,最终得到了解决,但我的思考没有停止:如何看待DeepSeek创作出(或深度参与)的批评文章的合法性?DeepSeek给当代文学批评,带来了哪些影响?好的文学批评,应当具备哪些特质?这些是DeepSeek或者说人工智能无法代替的吗?
感谢《当代作家评论》李桂玲老师、中国艺术研究院李静老师和《南方文坛》李北京老师的支持,他们的很多时间,都在看稿、审稿、改稿、校稿。希望他们的经验与分享能够给予大家点滴帮助,也希望我们能以更从容的心态,面对DeepSeek、面对外在环境、面对自己的内心。毕竟,DeepSeek不会焦虑,而需要缓解情绪的,也只有我们自己。
——李杨(《扬子江文学评论》编辑)
走出“平均化”陷阱:AI时代文学批评场域再反思
文/李静
2025年伊始,DeepSeek(以下简称DS)风靡,作为一名文学研究者与评论者,我也按捺不住让它生成当代文学批评的冲动,想要测试它“深度思考”的能力。在使用DS生成当代文学批评的尝试中,我特意做了一次人机同题写作的对比实验。我找出自己学生时代的一篇习作《现实主义的征途——论〈白鹿原〉的精神遗产》,这篇写于2016年陈忠实去世之际的评论试图从现实主义创作路径的突围与局限这一角度,梳理《白鹿原》留给我们的精神遗产,篇幅约4500字。以此为参照,我向DS-V3(使用公用聊天端,未经附加训练)提问:“请从现实主义创作传统与理论的角度解析陈忠实《白鹿原》的贡献与不足,有哪些精神遗产值得继承与发展。请撰写一篇4500字左右的文学评论。”它迅速生成一篇题为“走出乡土中国的史诗困境:论《白鹿原》的现实主义重构与精神遗产”的评论文章。比较人机同题写作,我发现两文的一个明显的不同点是,DS特别善于汇总与呈现信息(比如叙述故事梗概与主题、梳理众多人物形象),且纳入的文本量更多(包括梳理革命历史小说的现实主义传统,对比其他作家的家族史叙事等),因而视野显得更加宏观。
但比起我当年稚嫩的写作,DS生成的同题评论也未必就能胜出,它的重要缺陷便是“平均化”,或者说不断在重复那种四平八稳的“期刊八股体”。不可否认,DS等AI应用非常有效地提升了写作的下限,不止一位同行跟我提及,这两年学生的写作能力飞速提升,这大概率是AI辅助的结果。但其悖论性的效应,在于一方面有效拉高下限,一方面干扰上限的提升。越依赖AI,文学评论的亮点与个性就越为黯淡。下限提升与上限降低同源而生,结果就是大家被紧密地吸附于平均线上下,越来越浸泡于一种“平均化”的音调与信息环境之中。
AI并非“平均化”的罪魁祸首,我们需要在文化生态、批评场域与权力机制中挖掘原因。以我从事学术编辑工作的经验而言,许多期刊偏好叙述清晰、观点稳妥的文章类型,这势必会引导作者“定制”这类文章,而这又为DS提供了海量语料,模型据此生成的文章又会进一步规约作者表达,借助学术期刊等发表平台实现再生产。由此,问题便不止于“平均化”,而在于“平均化”的无限循环。
结合DS生成的《白鹿原》评论来看,其“平均化”弊端主要体现在结构模板化、文风(词汇、句式、修辞)均质化、理论滥俗化(各路主义对号入座)、观点同质化、判断保守化,等等。究其原因,这与DS的语料库与生成路径有关。其训练语料来自网络可爬取文本,其中被转载越多、格式最整齐的大多是媒体稿件、教材课件、论文与百科,相比之下,小众话题、私人/未被数字化的文本、方言表达就会愈加不可见,除非有意识地额外给模型“喂料”。DS在预训练阶段计算出的表达,正是最大概率出现在大多数场合的表达,由此看来AI输出的“平均化”正是现实表达趋于平庸稳妥的镜照。
但这还不是问题的重点。重点在于“平均化”无限循环的另外一端——人类作者的自我算法化、模式化、机器化。作为学术期刊的编辑,我们最头疼的问题是收到大量“80分”左右的平均之作,食之无味,弃之可惜。三段论,梳理脉络,材料配理论,再辅以大量“高级”但无可读性的文献,最终经常得出意料之中的结论——评论者可以快速习得“制作”此类评论文章的方法。深究背后强大的制约、诱导力量:从教学体系看,目前的批评写作训练加剧了可量化模板的应用,学生学习评论写作的第一目标,往往是快速习得“学术腔”;从考评机制看,唯数量、唯期刊等级、唯短期绩效,也使得更具效率亦即更套路化的写作方式更有市场;从发表与阅读来看,学院批评逐渐远离读者,发表评论文章成为圈子内部的“指标竞赛”,读者数量惨淡,难以获得真正的读者反馈及其所能发挥的校正作用。而在圈子内大量繁殖流通的评论文章,又会被大数据捕获与固化。因此,除去关注AI的技术特征与应用实践,当前尤其需要考虑与AI相适应的文学批评体制的优化改良。
想要走出“平均化”陷阱,除去思考制度安排,当然也需要评论者去发掘不能被AI轻易量化的能力与价值。依旧以《白鹿原》的评论为例,我撰写评论是以陈忠实离世为特定契机,携带着致敬、怀念与继承发展的伦理内涵,在对其“民族秘史”的长篇小说体裁进行分析时,特别将此放入20世纪90年代的时代语境中,呈现文体与社会的彼此建构,并以此烛照当前现实主义创作的困境。其中,形式与时代的相互塑造、陕西的地域经验、个体阅读体验与对当下状况的焦虑感是DS所生成的评论中没有的。另外,DS的文本分析偏于宏观全面,因而带有明显的“失焦感”,难以发掘文本的独特、细微、晦暗之处。总之,在文化/政治/情感意涵、独特文本细节、个体/时代/地方经验等方面,人类评论者还是有相当大的发挥空间的。
近年来,一些社科出身的写作者撰写的非虚构作品赢得许多关注,这或许说明,除去漫步于大数据的云端,我们非常需要深入的田野调查与现场观察。当然,“田野”同样可以被数据化,比如抖音、快手记录的生活样态可以被广泛取样与快速建模,但人类的田野观察不只是得到数据与趋势,更重要的是开展文化参与,给出文化深描,完成文学表达。这对于在“文本田野”上开展工作的批评实践同样具备启发意义。如何与文本建立更内在的联系,是评论者需要思考的。
言至于此,本文所论“平均化”陷阱似乎带有强烈的批判色彩,但实际上“平均化”更应被视为一种反思中介,借此显化批评实践与批评制度的种种不足,启发我们继续思考AI时代“何为批评,批评何为”。作者、版权制度、原创性、创作风格、文学性等一系列基石般的存在,将面临观念与制度多方面的重构。在此,我们不妨以AI与人类撰写评论的特点出发,对文学批评进行重新分类、分级:其一,信息型评论。出于快速浏览、获取信息,帮助鉴赏的目的,DS生成的评论或许就足够了。当然其中的AI幻觉、算法偏见有待自己核查。其二,研究型评论。涉及作品价值的评判、文本秩序的建立,抑或提供新概念、新方法时,人类评论者的能力就变得更为重要。若涉及跨语言、跨文本的关联,AI工具的“远读”能力助益颇多。其三,议题型评论。在借助文学作品打开社会生活议题,面向公众发言时,人类评论者的优势便更明显,更知晓社会语境下的问题意识。其四,反哺创作型批评。这类批评与创作者的互动更密切,AI工具与人类评论者的意见其实都有可能发挥作用,端看创作者的使用方式。在此意义上,笼统地讨论AI与文学批评的关系已不足取,必须更彻底地反思,更具体地设置讨论议程,更结实地培育呵护自身的评论能力。
因此,重构AI时代文学批评场域,起码意味着要在改良教学-发表评价制度、开掘与培养评论能力以及人机协作能力等诸多方面展开更具现实意义的探索,也亟须多学科的助力。我们期待在“平均化”的地平线之上,文学批评能够更为多元蓬勃地向上生长。
(作者系中国艺术研究院马克思主义文艺理论研究所副研究员)
图片来源:pixabay