点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:从ChatGPT的文学评论看机器文本的生成机制
首页> 光明文艺评论频道> 文艺原创 > 正文

从ChatGPT的文学评论看机器文本的生成机制

来源:光明网-文艺评论频道2023-03-15 10:02

  作者:张秀宁

  在概率论中有一个著名的故事:让一只猴子在打字机上随机按键,只要赋予其无限的时间,猴子必然能打出一部莎士比亚全集;而若是有无限只猴子,则能立刻打出任何文章,此即“无限猴子定理”。作为一个比喻,“猴子”所指代的是一个可以无限生成随机文本的工具,“打字机”则代表了意义无限的语言本身,“打字行为”的实质则是利用两个无限的交集来生成一个有限的子集。

  虽然“无限猴子定理”所主要阐释的是随机性,但它揭示了概率论视野下事件发生的基本前提——特定的选择机制和特定量级的内容库,而通过调节“随机”性和“数量”度,则能直接影响“莎翁全集”的生成速度。产生了巨大影响的ChatGPT之所以被命名为“大型语言模型”(Large Language Models),实际上就是通过降低“猴子”的随机性(提高正确语言答案出现的概率),提升“打字机”数量级(增加可学习的语言内容),进而提高生成“莎翁全集”的效率。

  通俗地说,ChatGPT的基本原理,即通过训练程序来有目的地学习人类语言知识和模式,从而生成高质量的文本。这里的“学习”其实是一套利用奖励机制调整程序的策略——基于人类标准,程序所生成的语言有可能是正确的,也有可能是错误的,那么通过正确的累加和错误的摈除,程序就能够持续地生成正确的文本。OpenAI一方面使用了万亿级的语料数据,一方面创造性地使用了人类与程序对话的方式来训练程序,从而使ChatGPT能够实现开放域对话并生成创造性内容,这使它区别于已有的各种AI。这尤其表现为,ChatGPT既能够对不特定领域的问题予以较高质量的回馈,也能够生产出形式和内容都颇为像模像样的类型化文本,这些成就可以说都是里程碑式的。OpenAI公司在概率计算方面取得了极大的突破,这一进步使ChatGPT能够利用巨量的备选语料组合出正确率极高的回答,以满足人类的期许,堪称基于“无限猴子定理”所进行的非常成熟的应用。

  ChatGPT能大量制造符合人类标准的文本,如果将这种表现定义为“创造力”,ChatGPT显然是成功的。当笔者向ChatGPT提问“你能够为文学研究提供什么帮助?”,其回答内容就包括“提供文学批评”,“提供有关文学作品的批评性评论,帮助研究者了解文学作品的优点和缺点。”当笔者进一步提问“你进行文学批评的原理是什么?”“你生成的文本是创造出来的吗?”,ChatGPT的回答是“根据问题的内容和上下文,搜索我学习的语料库,并选择最相关的信息作为回答。”而且,“我会根据问题的上下文和语境,使用我所学到的知识和技能,生成一段文本作为回答。因此,我生成的文本是根据我学到的知识和技能创造出来的,而不是直接从语料库中复制的。”显然,OpenAI公司对ChatGPT生成文本的能力高度自信。要进行“文学批评”必须要有相当的创造能力,这意味着ChatGPT基于概率控制能力的文本输出结果,要至少等同于人类大脑的输出结果。笔者曾试图让ChatGPT评价《阿Q正传》,其生成的文本基本可以达到中学语文论述题答案的水平。不难推论,随着算力、训练方法和语料库体量的进一步提高,其文本的水平还可以继续提升。

  然而,ChatGPT之所以能够表现如此良好,在很大程度上依赖于内容和评价标准的模糊性,也就是说,生成对象的指涉越是模糊,ChatGPT的输出结果就越令人满意;相应地,对生成对象的精确度要求越高,其表现就变得非常不尽如人意了。例如,笔者要求ChatGPT进行七位数的加法运算,其输出结果就难有正确的,这是因为在语料库中很少会有“5948972+7458923”之类的问题答案。这也就意味着,评判标准越多元、价值尺度越模糊,机器文本获得的认可度就越高。反之,机器文本的漏洞就越多。ChatGPT恐怕只有依照概率进行“猜测”的能力,但仍然不具备最基本的推理能力。因此,ChatGPT所生成的文本难以应用于对真实性、准确性、逻辑性具有真正需求的场合,不论科研报告、学术论文还是统计报表,ChatGPT所提供的答案都是值得怀疑的。归根结底,ChatGPT仍然只是一个语言模型,它能够在语言层面上掌握“模糊”这一手段,令人比较满意地回答标准不甚清晰的问题,但这一切也都只停留在语言层面上,还不能触及推理、判断乃至情绪。

  人类是拥有语言的动物,这一属性会令人对与其使用相同语言进行交流的对象(它甚至可以是一台机器)产生“人”的幻觉。ChatGPT一类的大型语言模型即有此能力,甚至让人类产生对方具有“灵感”“信念”“推理”能力的错觉。但实际上,目前这类程序使用语言的底层机制恐怕与人类截然不同,ChatGPT的语言能力仍然只是基于“猜测”(尽管其猜测的准确度已经非常之高),而人类显然并非如此。只是,语言属性引导着人类,使其发生误判。与其说是机器令人致幻,不如说是人类的语言属性令其入幻。

  而且,人类早已天然性地习惯了各种模糊性文本。正如人类社会需要大量的寒暄、问候、铺垫,人们对程式化、礼仪性文本的需求总是普遍和刚性的,这就为ChatGPT的实际应用创造了巨大的市场空间。不难想象,这一工具能为开场白、祝福语、欢迎词之类的写作,提供非常具有实际性的帮助。这也导致“人工智能夺走人类岗位”的说法甚嚣尘上。但问题的实质在于,对于那些程式化、礼仪性文本,恐怕并没有人在意其内容、深究其含义,接受者只需对这一“文本发出行为”产生恰当的反应,此类文本就算完成了任务。正如人们在接到“恭贺新春”的短信时,并不会深究这四个字的修辞结构、语言搭配、所蕴深意,只是产生了“对方遵行礼仪”的认知。ChatGPT也正是在这种模糊的语言维度上取得了很大进步,使人机之间能产生比较顺畅的交流。但对于内容的创造力、感染力、深度等,尚不能期待更多。

  由此可以看出,ChatGPT所生成的内容与基于自然语言所产生的内容之间恐怕还存在着巨大的质量差异,基于概率的“猜测”机制,决定了其生成的文本相对于原始语料,在语言之外的所有层面上仍然是匮乏的。哪怕ChatGPT真的拥有了“无限的猴子”和“无限的时间”,其生成的“莎翁全集”也依然只有语言这一个维度的意义,它所能产生的替代作用仍然是比较有限的。

  (作者张秀宁系南京邮电大学期刊社副编审)

  从ChatGPT的文学评论看机器文本的生成机制光明网文艺评论频道面向社会长期征集优秀稿件。诚邀您围绕文艺作品、事件、现象等,发表有态度、有温度、有深度的评论意见。文章2000字以内为宜,表意清晰,形成完整内容。来稿一经采用,将支付相应稿酬。请留下联系方式。感谢您的关注与支持!投稿邮箱:wenyi@gmw.cn

[ 责编:刘冰雅 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 《给阿嬷的情书》:一封跨越山海的情书,写给不曾断代的母语

  • 《植物学家》:影像的成就与叙事的悬置

独家策划

推荐阅读
十年来,我国经济学界牢记嘱托、深耕不辍,从中国经济发展的历史性成就、原创性经验中提炼理论、构建范式,逐步形成具有中国特色、中国风格、中国气派的经济学理论体系。
2026-05-15 10:20
在全面建设社会主义现代化国家的新征程上,“达到中等发达国家水平”作为一项承前启后的阶段性战略目标,正是这一重大时代课题的生动实践与具体体现。
2026-03-24 13:56
消费既是推动经济增长的重要引擎,也是人民多样化、多层次美好生活需要的直接体现。人是消费主体和生产主体,以人为本,关注经济社会发展过程中居民消费需求的变化与满足是扩大内需的路径之一。
2026-03-18 09:18
2025年12月18日,海南自由贸易港全岛封关运作正式启动,这一标志性事件不仅为中国对外开放写下全新注脚,更以制度型开放的突破之力,撬动着亚太地区经贸格局的深层变革。
2026-03-12 16:12
常态化精准帮扶的核心内涵是通过常态化的精准帮扶措施,不断提高被帮扶群体和地区的内生动力和可持续发展能力,实现高质量发展和共同富裕。
2026-02-24 09:32
做好骑手等新就业群体服务管理工作,根本在于实现认知层面从“视其为风险”到“塑其为力量”的深刻转变,实践层面从“碎片化管理”到“系统性治理”的全面升级。
2026-02-09 14:25
优化国土空间发展格局,核心是把分散的安排统起来、把多重目标协同起来。尤其是在存量时代,盘活老空间、优化新供给,推动用地功能重组,正成为提升治理现代化水平的关键一环。
2026-02-05 16:22
把握非遗活化利用的“度”,本质是处理“保护与利用”“传统与创新”“文化价值与经济价值”三组核心关系,这既是非遗传承的关键命题,也是文旅融合高质量发展的必然要求。
2026-01-30 09:18
2026年是“十五五”规划开局之年,做好经济工作至关重要。这“五个必须”,既对以往经济实践作出了深刻精辟的总结,也为做好当前和今后一个时期的经济工作提供了思想指引和行动指南。
2025-12-29 17:36
人力资本作为经济增长核心要素的地位被提升到了前所未有的高度。这种战略重心的转移深刻表明,在高质量发展的新阶段,“人”已不再仅仅被视为市场消费的终端,更是生产要素中最具能动性的价值源泉。
2025-12-25 10:52
高质量发展是以创新为第一动力的发展,意味着必须把以创新为特点的新质生产力作为高质量发展的重要内容和动力所在,以新质生产力发展推动经济增长方式从粗放式向集约式转变。
2025-12-10 09:01
加快建设现代化产业体系为何如此重要?“根基”二字有何深意?实体经济又该如何把握“智能化、绿色化、融合化”的主攻方向,实现从“制造大国”向“制造强国”跃升?
2025-11-19 15:41
优化营商环境不仅是激发市场主体活力的根本举措,更是打通文旅消费堵点、提升消费质量、激发消费潜能的“金钥匙”。
2025-11-05 10:52
一代代中国共产党人秉持初心使命,在宏伟蓝图指引下不断增强国家实力、丰富国际理念、落实行动计划,以中国式现代化开辟民族复兴新境界,铸就了中国国际地位历史性提升的坚实根基。
2025-10-31 09:42
上合组织必须坚持求同存异、互利共赢、开放包容、公平正义、务实高效五项原则,这是对“上海精神”的治理化表达,是将价值共识转化为可操作准则的关键一步。
2025-09-03 15:23
二十年来,“绿水青山就是金山银山”理念顺应了人民群众对优美生态环境的期待,打通了“绿水青山”与“金山银山”双向转换的堵点,引领了生态产品价值实现的有效途径。
2025-08-15 15:58
面对“内卷”困局,平台经济已经走到了必须转型的十字路口,而转型的主题词应该是“创新”和“价值”,它们是平台企业突破自身发展瓶颈的自救之路,更是中国经济从高速增长迈向高质量发展的时代要求。
2025-08-05 14:49
值此庆祝中国共产党成立104周年之际,回溯党的来时路,展望党的新征程,我们需要以更加强烈的历史主动精神推进中国式现代化,奋力实现中华民族伟大复兴的中国梦。
2025-07-02 09:25
发展数字经济是我国把握新一轮科技革命和产业变革新机遇的战略选择。面对创新涌现、迭代迅速的发展态势,我国积极顺应数字经济发展规律,审时度势调整发展政策。
2025-04-21 09:48
建立粮食产销区省际横向利益补偿机制,关键在于推进科技和改革双轮驱动。其中,改革的核心在于粮食政策创设与制度创新,调动和保护好农民种粮积极性,让农民种粮有奔头,让政府抓粮有动力。
2025-03-26 16:25
加载更多