点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

首页> 光明文艺评论频道> 看客 > 正文

文学可以计算吗?

来源:长江日报2020-01-25 08:46

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  作者:陈琰娇 南开大学文学院青年教师

  国内引进图书有个有趣的现象,那就是有时候会只译主标题不译副标题,又或者只译部分标题,各位看官若只是按名下单,有时不免文不对题。上回拿到一本《文学课:如何轻松理解伟大作品》,正准备学习一番,定睛一看才发现原书名里还有“for kids(给孩子的)”俩词没被译出。看来不是给我准备的书,只好转送中学生。这回发现一本《纳博科夫最喜欢的词》,兴致勃勃打开来,才发现这也并不是纳博科夫研究专著。纳博科夫喜欢什么词在这里仅仅是个引子,作者是要用统计的方法来研究“经典、畅销书和我们自己的写作背后的数据到底说明了什么”(What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing)。

  尽管有点“标题党”,但确也是一本有趣的书。作者的研究方法是用数据统计来研究文学作品,比如:都说优秀的作品副词少,那么到底要少到什么程度才算好,谁是用副词最少的作家?男女作家在用词习惯上有什么不同,书中的男女角色在表现上有不同吗?我们会在自己的写作中留下“指纹”吗?什么样的开头结尾更受欢迎?当然,看到这里,也许你现在也有了一个疑问——这一连串的“十万个为什么”也算文学研究吗?

  随着人工智能热潮的到来,“大数据”成为了这几年最热门的话题之一。不仅互联网要关心大数据,人文社科领域也要研究人工智能,思考数字人文。不仅现代影视剧要将数据库的功能可视化,像《长安十二时辰》这样的古装片中也出现了“大案牍术”,也就是原始的数据管理系统。那么接下来的问题便是,文学真的可以计算吗?

  书一开篇,作者就讲了一个破案的故事。话说美国的《联邦党人文集》,收录了汉密尔顿、麦迪逊和杰伊三位政治家的85篇文章,影响深远。由于文章刊发时是共用笔名,所以一开始谁都没说哪篇是自己的。后来汉密尔顿在给朋友的信中分别列出了各篇文章的作者,再后来麦迪逊又说汉密尔顿认领的文章中,有12篇是他写的,于是这作者之争一吵就是一百多年,各方学者谁也说服不了谁。直到1963年,才由两位教授给出了明确答案,而他们既不研究历史,也不研究政治,是货真价实的统计学家。

  说来也简单,两位学者分别统计了麦迪逊和汉密尔顿文章中的高频词,再将高频词与12篇文章比对。比如在已确认是麦迪逊的文章中,超过一半使用了“whilst”而“while”从未出现,而汉密尔顿的文章则恰恰相反,三分之一使用了“while”而“whilst”从未出现。类似这样的词,他们选出几十个,逐一对比,最终确认麦迪逊的确是12篇文章的作者。就这样,困惑了历史学家两个世纪的问题,最终被计算机解决了。

  沿着这个思路,作者选了9个有趣的话题,对文学作品进行了新的审视。也因此,他才能准确地回答(按照作者统计标准)纳博科夫最喜欢的词是“mauve(淡紫色)”,简奥斯汀最喜欢的三个词是“civility(礼貌)”“fancying(幻想)”和“imprudence(轻率)”,而阿加莎克里斯蒂则是“inquest(审讯)”“alibi(不在场证明)”和“frightful(可怕的)”。

  尽管知道了名家最爱用的词、副词使用率、畅销书的性别气质,这样的“文学统计学”也不会在短时间内影响作家的写作和我们对作品的看法,甚至数字人文这个研究领域也存在方法和路径上的争议。但反过来,计算机辅助文本处理技术的发展又的确给我们带来了看待作品的新视角,让我们看见了文本中隐藏的“指纹”。也正是准确无误的数据统计让我们看到了文本背后的无意识,为什么作品会呈现出“这样”的特点,或许值得我们继续思考。(陈琰娇)

[ 责编:王营 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 《烟火人间》:与媒介共生,与生活共舞

  • 张凯滨:演技类综艺怎能靠槽点、笑点制造爆点

独家策划

推荐阅读
高质量构建“大思政课”工作体系要聚焦目标、效果和特色,着力破解思政课建设中的重点、难点和关键问题,带动思政课叙事表达体系和场景体验模式的深层变革。
2024-03-18 10:28
中华文化的主体性植根于5000多年的文化沃土,是在创造性转化、创新性发展中华优秀传统文化、传承革命文化、发展社会主义先进文化的基础上,借鉴吸收人类一切优秀文明成果的基础上建立起来的。
2024-03-08 16:31
数字化网络化智能化加速发展,各国既面临着新的发展机遇,也需要应对新的全球性问题,国际社会迫切需要携手合作,共同打造和平、安全、开放、合作的网络空间,携手构建网络空间命运共同体。
2024-03-01 14:51
中华民族传统节日春节即将到来。值此之际回望2023年,中国经济主要预期目标圆满实现。展望新的一年,我国经济发展依然将面临一些困难和挑战,但同时也具有体量大韧性强创新后劲足的竞争优势、宏观经济政策回旋空间大的支撑效应、新一轮全面深化改革开放的增长红利等三重有利支撑。
2024-02-09 16:37
要聚焦新时代新征程党的中心任务,以加快政府职能转变和优化政府职责体系为重点,在“加减乘除”上做文章,推进机构改革再深化,为在新征程上全面推进中国式现代化提供新动力。
2024-01-30 11:31
面对不断升级的数字社交产品,反而需要青年人意识到沉浸式社交环境背后的营销策略与运作逻辑,从而与社交媒体生成的感官刺激与虚拟自我保持距离。
2024-01-15 09:41
“人民美好生活需要”的提出,内含着马克思主义的价值宗旨,体现社会主义的本质要求,根植于中国经济社会发展实际,符合中国共产党的初心使命,体现合规律性与合目的性的高度统一。
2024-01-12 09:39
冬至阳生,岁回律转。在新的一年,我们站在这一年的不易成果上,对未来充满信心,更加需要接续奋斗、砥砺前行,取得更多发展成果。
2024-01-04 15:35
针对目前思政课教师供给能力不能有效满足思政课强起来的发展需要这一突出矛盾,要切实提升教师供给能力,改进教学方式,推动新时代思政课朝着高质量发展。
2023-12-14 17:59
我国始终主动实行扩大进口的战略和政策,连续举办进口博览会,倡导开放合作,与既往的贸易保护理论和政策主张存在根本差异,为维护开放的世界经济注入了强大动力。
2023-11-09 10:22
面向未来,要进一步扩大“朋友圈”,绘制好“工笔画”,对接好“硬联通”与“软联通”,秉持包容、合作、共赢的原则,为实现民族复兴和推进全人类的福祉而努力奋斗。
2023-10-24 11:06
文化交流很重要,我们在讲“一带一路”的时候,也需要讲“共建国家”给我们带来的好处。其实我们面临着如何正确对待自己的问题,“一带一路”不是单方面的施与,而是双向的或多向的互利。
2023-10-10 09:58
我们必须要全面把握东北向北开放的历史使命,通过推动东北亚次区域、国别合作,破解东北亚各国战略意图和利益不同、战略互信缺失的困境。
2023-09-27 09:53
2022年我国数字经济规模达50.2万亿元,总量稳居世界第二,同比名义增长10.3%,占国内生产总值比重提升至41.5%,数字经济成为我国稳增长促转型的重要引擎。
2023-09-15 10:49
坚持以习近平法治思想和总体国家安全观为指导,准确把握完善国家安全法治体系的时代内涵和实现路径,是新时代新征程把中国特色国家安全法治建设推向前进的必由之路。
2023-08-22 09:41
习近平总书记进一步推进马克思主义基本原理同中国具体实际、同中华优秀传统文化相结合,创造性回答了关系党和国家事业发展的重大问题,形成一系列原创性理论成果。
2023-08-18 09:14
深刻的理论来源于人民大众的实践,只有不断拓展理论的深度和广度,用“大众话语”说清“理论话语”,理论才能真正变成人民群众手中的尖锐武器。
2023-07-18 17:59
“千万工程”把村庄整治与发展经济结合起来,以乡村经营为抓手,持续打通“绿水青山就是金山银山”转化通道,将生态红利变为民生福利。
2023-07-12 09:32
区域国别学是典型的交叉学科,只有从不同学科视角贡献知识增量,通过融合、碰撞和创新,才能最终形成学科共识。
2023-06-28 09:36
加载更多