点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

作者:刘宇彤
近年来,生成式AI(人工智能)在文学创作领域的应用潜力备受关注,国内各大科技企业、大模型研发机构纷纷推出面向文学创作的专属模型与辅助工具,网文创作平台也积极布局AI创作赛道。比如,阅文集团推出的“作家助手”接入DeepSeek-R1大模型,带来AI功能使用率与用户日活跃度的显著增长;中文在线依托自研的“中文逍遥”写作平台,打造了从构思生成到情节续写全流程AI辅助的创作体系。纵观全局,AI创作首先在诗歌、词条、短篇故事等短文本领域掀起使用热潮,现已逐步开始尝试长篇小说生成并进行商业化试水,成为文学创作领域的新兴探索方向。
但AI是否真正具备“创作”小说的能力,目前尚无确切定论,关注生成式AI的数据标注环节恰是解构其创作能力的关键切口。所谓数据标注是AI模型训练的基础环节,简而言之,就是为AI算法提供训练样本。在文学创作领域,数据标注的具体表现是向大模型提出写作要求,结合其反馈结果从语词使用、语义结构、叙事逻辑与审美表达等方面进行审视并开展二轮提问,训练AI生成更契合人类理解的文学文本。这一过程不仅是单纯的技术操作,更是人类审美与AI交互的文化实践。而数据标注实践中浮现出的诸多现实问题,也成为窥探AI文学“创作”边界的重要窗口,其间多重创作困境也正由此逐步显现。
目前的AI创作高度依赖于已有的文学素材,如刘震云所说,“AI创作是对过去的总结”,尚无法自主生成面向未来的创新性内容。即便是对过去内容的模仿或续写,AI的学习和创作能力也是有限度的,尚停留在浅层阶段。学习能力不足的缺陷在仿写名家作品时格外突出,目前,AI的“学习”仅能做到复刻经典作品的形式,还难以真正内化某种文学风格与作品的精神内核。比如,要求AI仿写鲁迅的乡土小说,它或许能够熟练运用冷峭凝练的句式,堆砌诸如百草园、瓜田、社戏等意象,甚至模仿鲁迅式的反讽笔法,却无法传达出文字背后深刻的国民性批判与对底层民众的悲悯。
在古典文学领域,AI创作更易陷入辞藻堆砌、意蕴空疏的尴尬境地,或是出现将名作诗句重新排列组合的“剽窃”现象。让AI仿写古典诗词,做到适配韵律平仄不难,难的是避免因刻意押韵而导致的意象堆砌、逻辑杂乱。目前,不少AI模型写出的词句看似对仗工整,表意却晦涩不通,更难以营造出浑然天成的意境。究其原因,AI的标注训练本质上是语词、句式、典型意象等表层要素的标签化提取与匹配,标注者无法将人类对文学作品的情感体悟与思想解读完全转化为算法可识别的训练逻辑,也无法教会AI理解“诗言志”“情生诗歌”的核心内涵。于是,AI的“学习”只得其形,却失了神。
凭借浅层的模仿与生成能力,AI创作批量介入程式化的网络文学或短剧剧本创作,的确能在短时间内创造出显著的经济效益,甚至形成相对成熟的产业链。但在高质量文本创作或经典文本续写实践中,AI创作的可操作性还有待提升。同时,AI机械化理解创作指令的问题也较为突出,典型表现便是机械复刻指令中的字句。目前的AI模型在接收创作指令时,通常只能对关键词进行简单提取整合,无法语境化解读整体创作要求。以一次散文训练为例,当标注者下达“写一篇抒情散文,描绘秋日的城市公园”的指令后,得到的可能是“秋日”“城市”“公园”等关键词的重复罗列,此类情况往往出现在未成熟大模型的初期训练阶段。但即使是在进阶训练阶段,AI创作仍可能会因理解能力的缺失,出现文本格式与创作要求相悖的一些低级错误,比如,要求以分镜格式生成剧本,得到的却是一篇完整的小说。笔者还注意到,目前市面上通行的一些AI创作工具,在理解包含修辞或隐喻表达的指令时,也容易有力不从心的情况,甚至会生成与创作初衷南辕北辙的内容。这种对指令的机械化理解使得AI创作难以精准契合人类的创作需求,也使其无法比拟真正的文学创作。此外,AI的基本创作能力也存在诸多缺陷,多语种杂糅、叙事逻辑断裂、情节套路陈旧等问题频发,进行长文本创作的续航能力明显不足。这或许是因为,数据标注所用的文学样本虽数量庞大,却多为碎片化的零散案例,难以令AI习得整体驾驭文本的能力,在叙事逻辑的流畅性、语言风格的统一性及情节结构的创新性方面缺乏有效训练。
当然,除却上述AI创作困局,现如今,我们更需警惕的是数据标注环节背后可能存在的人文精神缺失问题。在训练大数据模型的过程中,标注者也置身于尚未成熟的“拟文学”语境里。长此以往,标注者自身的文学感知力与审美判断力,可能会在标签化、程式化的标注工作中被无形窄化。因此,我们必须以更为审慎的批判态度,重新思考生成式AI与文学创作的关系。AI创作虽具备一定的发展潜力,却不宜盲目夸大其价值,亦不可忽视技术应用过程中潜藏的人文危机。唯有兼顾技术赋能与文学本真,融合二者所长,坚守人类的文化主体性,方能守护文学创作独有的人文温度与精神内核。(刘宇彤)
