点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:从ChatGPT的文学评论看机器文本的生成机制
首页> 光明文艺评论频道> 文艺原创 > 正文

从ChatGPT的文学评论看机器文本的生成机制

来源:光明网-文艺评论频道2023-03-15 10:02

  作者:张秀宁

  在概率论中有一个著名的故事:让一只猴子在打字机上随机按键,只要赋予其无限的时间,猴子必然能打出一部莎士比亚全集;而若是有无限只猴子,则能立刻打出任何文章,此即“无限猴子定理”。作为一个比喻,“猴子”所指代的是一个可以无限生成随机文本的工具,“打字机”则代表了意义无限的语言本身,“打字行为”的实质则是利用两个无限的交集来生成一个有限的子集。

  虽然“无限猴子定理”所主要阐释的是随机性,但它揭示了概率论视野下事件发生的基本前提——特定的选择机制和特定量级的内容库,而通过调节“随机”性和“数量”度,则能直接影响“莎翁全集”的生成速度。产生了巨大影响的ChatGPT之所以被命名为“大型语言模型”(Large Language Models),实际上就是通过降低“猴子”的随机性(提高正确语言答案出现的概率),提升“打字机”数量级(增加可学习的语言内容),进而提高生成“莎翁全集”的效率。

  通俗地说,ChatGPT的基本原理,即通过训练程序来有目的地学习人类语言知识和模式,从而生成高质量的文本。这里的“学习”其实是一套利用奖励机制调整程序的策略——基于人类标准,程序所生成的语言有可能是正确的,也有可能是错误的,那么通过正确的累加和错误的摈除,程序就能够持续地生成正确的文本。OpenAI一方面使用了万亿级的语料数据,一方面创造性地使用了人类与程序对话的方式来训练程序,从而使ChatGPT能够实现开放域对话并生成创造性内容,这使它区别于已有的各种AI。这尤其表现为,ChatGPT既能够对不特定领域的问题予以较高质量的回馈,也能够生产出形式和内容都颇为像模像样的类型化文本,这些成就可以说都是里程碑式的。OpenAI公司在概率计算方面取得了极大的突破,这一进步使ChatGPT能够利用巨量的备选语料组合出正确率极高的回答,以满足人类的期许,堪称基于“无限猴子定理”所进行的非常成熟的应用。

  ChatGPT能大量制造符合人类标准的文本,如果将这种表现定义为“创造力”,ChatGPT显然是成功的。当笔者向ChatGPT提问“你能够为文学研究提供什么帮助?”,其回答内容就包括“提供文学批评”,“提供有关文学作品的批评性评论,帮助研究者了解文学作品的优点和缺点。”当笔者进一步提问“你进行文学批评的原理是什么?”“你生成的文本是创造出来的吗?”,ChatGPT的回答是“根据问题的内容和上下文,搜索我学习的语料库,并选择最相关的信息作为回答。”而且,“我会根据问题的上下文和语境,使用我所学到的知识和技能,生成一段文本作为回答。因此,我生成的文本是根据我学到的知识和技能创造出来的,而不是直接从语料库中复制的。”显然,OpenAI公司对ChatGPT生成文本的能力高度自信。要进行“文学批评”必须要有相当的创造能力,这意味着ChatGPT基于概率控制能力的文本输出结果,要至少等同于人类大脑的输出结果。笔者曾试图让ChatGPT评价《阿Q正传》,其生成的文本基本可以达到中学语文论述题答案的水平。不难推论,随着算力、训练方法和语料库体量的进一步提高,其文本的水平还可以继续提升。

  然而,ChatGPT之所以能够表现如此良好,在很大程度上依赖于内容和评价标准的模糊性,也就是说,生成对象的指涉越是模糊,ChatGPT的输出结果就越令人满意;相应地,对生成对象的精确度要求越高,其表现就变得非常不尽如人意了。例如,笔者要求ChatGPT进行七位数的加法运算,其输出结果就难有正确的,这是因为在语料库中很少会有“5948972+7458923”之类的问题答案。这也就意味着,评判标准越多元、价值尺度越模糊,机器文本获得的认可度就越高。反之,机器文本的漏洞就越多。ChatGPT恐怕只有依照概率进行“猜测”的能力,但仍然不具备最基本的推理能力。因此,ChatGPT所生成的文本难以应用于对真实性、准确性、逻辑性具有真正需求的场合,不论科研报告、学术论文还是统计报表,ChatGPT所提供的答案都是值得怀疑的。归根结底,ChatGPT仍然只是一个语言模型,它能够在语言层面上掌握“模糊”这一手段,令人比较满意地回答标准不甚清晰的问题,但这一切也都只停留在语言层面上,还不能触及推理、判断乃至情绪。

  人类是拥有语言的动物,这一属性会令人对与其使用相同语言进行交流的对象(它甚至可以是一台机器)产生“人”的幻觉。ChatGPT一类的大型语言模型即有此能力,甚至让人类产生对方具有“灵感”“信念”“推理”能力的错觉。但实际上,目前这类程序使用语言的底层机制恐怕与人类截然不同,ChatGPT的语言能力仍然只是基于“猜测”(尽管其猜测的准确度已经非常之高),而人类显然并非如此。只是,语言属性引导着人类,使其发生误判。与其说是机器令人致幻,不如说是人类的语言属性令其入幻。

  而且,人类早已天然性地习惯了各种模糊性文本。正如人类社会需要大量的寒暄、问候、铺垫,人们对程式化、礼仪性文本的需求总是普遍和刚性的,这就为ChatGPT的实际应用创造了巨大的市场空间。不难想象,这一工具能为开场白、祝福语、欢迎词之类的写作,提供非常具有实际性的帮助。这也导致“人工智能夺走人类岗位”的说法甚嚣尘上。但问题的实质在于,对于那些程式化、礼仪性文本,恐怕并没有人在意其内容、深究其含义,接受者只需对这一“文本发出行为”产生恰当的反应,此类文本就算完成了任务。正如人们在接到“恭贺新春”的短信时,并不会深究这四个字的修辞结构、语言搭配、所蕴深意,只是产生了“对方遵行礼仪”的认知。ChatGPT也正是在这种模糊的语言维度上取得了很大进步,使人机之间能产生比较顺畅的交流。但对于内容的创造力、感染力、深度等,尚不能期待更多。

  由此可以看出,ChatGPT所生成的内容与基于自然语言所产生的内容之间恐怕还存在着巨大的质量差异,基于概率的“猜测”机制,决定了其生成的文本相对于原始语料,在语言之外的所有层面上仍然是匮乏的。哪怕ChatGPT真的拥有了“无限的猴子”和“无限的时间”,其生成的“莎翁全集”也依然只有语言这一个维度的意义,它所能产生的替代作用仍然是比较有限的。

  (作者张秀宁系南京邮电大学期刊社副编审)

  从ChatGPT的文学评论看机器文本的生成机制光明网文艺评论频道面向社会长期征集优秀稿件。诚邀您围绕文艺作品、事件、现象等,发表有态度、有温度、有深度的评论意见。文章2000字以内为宜,表意清晰,形成完整内容。来稿一经采用,将支付相应稿酬。请留下联系方式。感谢您的关注与支持!投稿邮箱:wenyi@gmw.cn

[ 责编:刘冰雅 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 周思明:精品化引领微短剧创作

  • 《雪豹》:走进生命的诗篇

独家策划

推荐阅读
数字基础设施是数字经济发展的底座,是网络强国、数字中国建设的基石。要立足不同产业特点和差异化需求,推动经济产业全方位、全链条网络化、数字化、智能化转型。
2024-04-23 16:17
高质量构建“大思政课”工作体系要聚焦目标、效果和特色,着力破解思政课建设中的重点、难点和关键问题,带动思政课叙事表达体系和场景体验模式的深层变革。
2024-03-18 10:28
中华文化的主体性植根于5000多年的文化沃土,是在创造性转化、创新性发展中华优秀传统文化、传承革命文化、发展社会主义先进文化的基础上,借鉴吸收人类一切优秀文明成果的基础上建立起来的。
2024-03-08 16:31
数字化网络化智能化加速发展,各国既面临着新的发展机遇,也需要应对新的全球性问题,国际社会迫切需要携手合作,共同打造和平、安全、开放、合作的网络空间,携手构建网络空间命运共同体。
2024-03-01 14:51
中华民族传统节日春节即将到来。值此之际回望2023年,中国经济主要预期目标圆满实现。展望新的一年,我国经济发展依然将面临一些困难和挑战,但同时也具有体量大韧性强创新后劲足的竞争优势、宏观经济政策回旋空间大的支撑效应、新一轮全面深化改革开放的增长红利等三重有利支撑。
2024-02-09 16:37
要聚焦新时代新征程党的中心任务,以加快政府职能转变和优化政府职责体系为重点,在“加减乘除”上做文章,推进机构改革再深化,为在新征程上全面推进中国式现代化提供新动力。
2024-01-30 11:31
面对不断升级的数字社交产品,反而需要青年人意识到沉浸式社交环境背后的营销策略与运作逻辑,从而与社交媒体生成的感官刺激与虚拟自我保持距离。
2024-01-15 09:41
“人民美好生活需要”的提出,内含着马克思主义的价值宗旨,体现社会主义的本质要求,根植于中国经济社会发展实际,符合中国共产党的初心使命,体现合规律性与合目的性的高度统一。
2024-01-12 09:39
冬至阳生,岁回律转。在新的一年,我们站在这一年的不易成果上,对未来充满信心,更加需要接续奋斗、砥砺前行,取得更多发展成果。
2024-01-04 15:35
针对目前思政课教师供给能力不能有效满足思政课强起来的发展需要这一突出矛盾,要切实提升教师供给能力,改进教学方式,推动新时代思政课朝着高质量发展。
2023-12-14 17:59
我国始终主动实行扩大进口的战略和政策,连续举办进口博览会,倡导开放合作,与既往的贸易保护理论和政策主张存在根本差异,为维护开放的世界经济注入了强大动力。
2023-11-09 10:22
面向未来,要进一步扩大“朋友圈”,绘制好“工笔画”,对接好“硬联通”与“软联通”,秉持包容、合作、共赢的原则,为实现民族复兴和推进全人类的福祉而努力奋斗。
2023-10-24 11:06
文化交流很重要,我们在讲“一带一路”的时候,也需要讲“共建国家”给我们带来的好处。其实我们面临着如何正确对待自己的问题,“一带一路”不是单方面的施与,而是双向的或多向的互利。
2023-10-10 09:58
我们必须要全面把握东北向北开放的历史使命,通过推动东北亚次区域、国别合作,破解东北亚各国战略意图和利益不同、战略互信缺失的困境。
2023-09-27 09:53
2022年我国数字经济规模达50.2万亿元,总量稳居世界第二,同比名义增长10.3%,占国内生产总值比重提升至41.5%,数字经济成为我国稳增长促转型的重要引擎。
2023-09-15 10:49
坚持以习近平法治思想和总体国家安全观为指导,准确把握完善国家安全法治体系的时代内涵和实现路径,是新时代新征程把中国特色国家安全法治建设推向前进的必由之路。
2023-08-22 09:41
习近平总书记进一步推进马克思主义基本原理同中国具体实际、同中华优秀传统文化相结合,创造性回答了关系党和国家事业发展的重大问题,形成一系列原创性理论成果。
2023-08-18 09:14
深刻的理论来源于人民大众的实践,只有不断拓展理论的深度和广度,用“大众话语”说清“理论话语”,理论才能真正变成人民群众手中的尖锐武器。
2023-07-18 17:59
“千万工程”把村庄整治与发展经济结合起来,以乡村经营为抓手,持续打通“绿水青山就是金山银山”转化通道,将生态红利变为民生福利。
2023-07-12 09:32
加载更多