四川作家网 > 新闻 > 网络文学
刘洋:人工智能时代,如何计算文学?
来源:媒后台(微信公众号) 编辑: 时间:2024-05-11

2024年4月28日上午,重庆大学中文系副教授、知名科幻作家、凝聚态物理学博士刘洋做客“新媒体理论与实践”课堂,为同学们带来讲座《人工智能时代的文学计算研究——叙事、网络、情感与分形结构》。讲座由北京大学中文系教授邵燕君主持,线上线下同步进行。新加坡国立大学中文系副教授徐兰君、清华大学写作中心讲师耿弘明也莅临现场,展开了精彩的学术对话。

刘洋老师是数字人文方向的先驱学者,有跨人文社科与自然科学的学术背景,而且兼具作家身份,对研究及创作都有深入见解。文学计算是数字人文领域下的研究方向之一,人工智能算法的迅速发展,为文学计算研究带来了新的机遇。


一、文学可以计算吗?


刘洋老师首先提出了文学是否可以或应该进行量化研究的问题。通过引用科幻小说《基地》中的心理史学概念,他指出,文学创作看似具有随机性,但每个作家的特定作品中,其遣词用句是有限制条件的,例如作家的词汇量、语法结构等。文学作品的某些特征可以进行量化分析,这种分析不仅可行,而且在面对海量文本和人工智能生成文本的背景下,显得尤为必要。

当前,文学计算的研究框架主要包括四个步骤:语料库的准备、数学建模、特征量建构和文本细读。刘洋老师强调,语料库的建立需要经过结构化标注和向量化转换,这是文学计算的基础。他展示了一个科幻小说《地铁》的文本片段作为结构化标注的示例,包括词性标注、要素标注以及叙事形式的标注。标注往往需要大量的人工操作,但大语言模型出现后,通过“教会”大模型标注的方法,可以简化标注的工作量。向量化转换则是指将文本转换为数学向量,以便于计算机处理和分析。

待语料库准备好后,则需根据所研究的问题进行数学建模。例如,要研究文学中的“比喻”,则要寻找“比喻”在数学上如何表达。接下来,刘洋老师提出了通过特征量建构来量化文学概念的方法。例如,通过分析科幻小说中的设定网络,可以量化地评估小说的自洽性。最后,结合文本细读,来考察特征量是否合适。


二、研究方向与大语言模型的应用


刘洋老师介绍了几种主要的文学计算研究方向,包括:

1. 计量风格学:上世纪文学计算的主流,对作家的写作风格进行量化分析。例如,可以通过分析作家作品中的句子长度分布来识别作家风格。

2. 角色网络分析:构建角色之间的关系网络,以分析叙事结构。例如,观察在小说的网络结构中,角色处于中间位置还是边缘位置,是否形成团体。

3. 计量叙事学:量化叙事学概念,如叙述聚焦、叙事节奏。由于叙事学的概念不明确,目前量化研究存在一些困难。目前,利用大语言模型进行叙事形式识别的准确度较高,可以用于叙事研究。

4. 情感计算:分析文学作品中的情感走向,建立情感弧线。刘洋老师以“情感丰富度”和“情感曲折度”两个特征量为例,对比科幻作家的风格,可以发现刘慈欣的作品情感较为克制,王晋康的作品则较为热情。而且整体而言,男性作家与女性作家在情感坐标系上没有很大的区别。

5. 分形结构分析:研究文本的自相似结构,以量化文学作品的复杂性。例如,《平凡的世界》比网络小说《绝世武魂》在分形维度上指数更高,说明前者的叙事更具复杂度,这可能有助于解决文学性等概念的问题。

6. 机器学习与文学计算:利用机器学习算法进行文本分类、情感提取和人物性格分析等。刘洋老师通过《三体》和《地铁》的对比案例展示了如何使用机器学习来区分不同作者的风格。通过统计文本中虚词的出现频率,并将其作为特征向量输入机器学习,可以较为准确地实现对作者风格的自动识别。

大语言模型因其出色的语义理解能力,在文学计算中具有巨大潜力。它可以进行文本标注、生成文本、辅助编程、实体识别和要素归因。不过,大语言模型也存在一些局限性:机器学习主要用来分类和预测,与大多数文学研究的需求不匹配;机器学习需要大型语料库进行学习,但文学研究未必能提供足够的文本;标注任务繁重,且很难外包;向量化会导致信息的流失等。


三、学科交叉的未来展望


在讲座的尾声,刘洋老师总结道,未来的文学计算需要从建立更大的向量化语料库、开发更高层次的特征量和结合数值计算与传统阐释三个方面来发展。文学计算的核心是进行数字细读,即在传统的文本分析基础上,利用计算方法来扩展研究的范围和深度。他期望有更多的人文学者介入,以文学计算的方法分析深层次的文学问题。

主持人邵燕君老师首先表达了对刘洋老师的衷心感谢,认为这是一次“干货满满”的透彻讲解,既有理论又有实践,既精深又不失全面。耿弘明老师认为刘洋老师在文学计算领域做出了前沿的研究工作,并且涵盖了中文学界和英文学界对文学计算的各种可能性。同时,耿老师也建议刘洋老师未来能与更多传统人文学者合作,以期产生更多创新性的工作。

接下来,徐兰君老师提出了关于跨学科研究发表过程中可能遇到的困难,如评审者可能对文学维度的理解不足,以及如何建立跨学科的评价体系。对此,刘洋老师分享了自己在发表跨学科论文时的经历,如评审者对研究实用性的质疑,以及自然科学与人文学科之间的话语体系差异。尽管存在部分沟通障碍,但跨学科合作是必要的,学者们也正作出克服障碍的努力。

本次讲座还有近百位同学线上参加,线上的同学们在提问环节积极发言,刘洋老师以科幻小说中如何推演设定为例,说明了文学计算应用于文学创作的可能性。最后,刘洋老师和现场在座同学也进行了深入交流。文学计算作为一种新兴研究,为分析文学作品提供了新的工具和视角。刘洋老师的讲座不仅为同学们展示了文学计算的技术细节,而且激发了对于文学、科技以及学科交叉融合的深刻思考。

上一篇:以丰富史实确证网络文学的潮动与变迁
下一篇:没有了