百年清华

矣晓沅:文理科是我们和世界交互的两种方式

2021-03-31 | 矣晓沅(2012级计算机) | 来源 《光明日报》2021年03月30日 |

我对文学的热爱从上初中的时候就开始了。那时因为生病休学两年,一直在医院做治疗。有一次去医院住院,就在书店买了很多书带去。那应该是我第一次看那么多课外书籍,从此喜欢上了文学。在生病休学的两年时间里,我阅读了非常多文学作品,鲁迅、老舍……还有日本文学、拉美文学等,属于一个兼收并蓄的状态。

阅读文学作品让我有不同的角度去看待生活和看待世界。当时因为病情加重,我对生活、对自己的身体恢复有很多焦虑和压力,但这些作品和作家却让我很受启发。想到这个世界上有非常多精彩的人和精彩的生活,就激励我继续努力。另外,我自己身体不好,没办法去不一样的地方、感受不一样的生活,但我可以通过书籍去了解。所以当时阅读不是为了应试,也不是当作提高分数的技巧,而是抱着欣赏的态度去阅读。即使高中选择了理科,我对文学的热爱也没有改变。

我觉得文理其实不矛盾,是我们和世界交互的两种方式。理科告诉我们怎样从数学规律上去认识或去改造这个世界,但文科是告诉我们如何去感受这个世界。不管是学习还是做科研,文学对我起到了非常大的滋养作用。

比如博士生做研究,要求的是一种综合性的能力和素质,并不是论文发表就结束了。从设计模型推导数学公式,到写代码做实验,得出成果,写文章。文章写完需要在大众面前展示讲解,还要宣传科研成果。这里面不仅仅涉及理论能力,对表达能力、交流能力、写作能力都有非常高的要求。

我一直对文学感兴趣,自己也写过很多文章或者诗歌,由此我的表达能力和交流能力都得到了很好的锻炼。还有一个比较好的契机是我从高中就参加辩论,进清华之后也加入了校辩论队。四年多的辩论时间,我的表达能力尤其是思辨能力有非常大的提升。这些能力实际上都更好地帮我去做科研。

理科更多的是锻炼人的逻辑能力,写文章时会更有清晰的逻辑脉络、清晰的表达和结构。而在认识或是解决问题的时候,往往并不是一个简单的数学形式,或一个简单的物理形式。这时如果有一些文科的背景和经历,能让我做判断的时候更加合理或者说更人性化一些。这其实是文理科之间的交互。

在我们设计九歌(智能诗歌创作系统)的时候,并不只是在数学的理论里去进行公示推导和做模型设计,还会参考文学、语言学、心理学、认知科学的知识。比如,此前我们甚至从《文心雕龙》中得到启发,用这种启发指导整个模型设计的思路,优化诗歌写作系统。

一首诗歌在上下文上应有连贯性和整体性,但之前很多模型自动创作出来的诗歌是支离破碎的,一首绝句的前两句和后两句写的是完全不同的主题,两个主题之间没有任何衔接和过渡,这样对整个诗作的质量有非常大的影响。

所以我们想解决的就是如何提升所生成诗歌的连贯性和整体性。每一句诗需要和上文有紧密衔接和自然过渡,但也不能用规则约束得太死板,要有一定的自由和发挥的空间,这非常难。

《文心雕龙·章句》里有一段话:“裁文匠笔,篇有小大;离章合句,调有缓急;随变适会,莫见定准……故能外文绮交,内义脉注,跗萼相衔,首尾一体。若辞失其朋,则羁旅而无友;事乖其次,则飘寓而不安。”

这段话给我们的启发是,不需要事先设计好哪一部分怎么写,而是“随变适会,莫见定准”,在写的过程中,没有固定的计划或结构,而是动态、灵活地去构建一首诗的整体骨架,这可以对应到诗歌写作理论中的“意脉”这一概念。这个框架设计的要求就是既要和上文相关,但同时又不能有非常严格、生硬的约束,有一定的灵活性和自由发挥的空间,这是“形而上”给我们的启发。

根据这个启发我们再进行详细设计。在具体诗歌的生成过程中,会实时一句一句地自动生成。每生成一句,我们会设计一个算法,把里面的关键意象提取出来,在上文里保留这些关键意象,再用这些关键意象指导下文的生成。诗歌里会有很多虚词,在我们领域里叫停用词,比如“之”“又”“却”等对下文没有特别明显或者特别显著的意义。一般在计算机语言学里面,我们认为名词、形容词、动词等是有明显的语义特征,这些关键意象就会保留下来,用来引导下文的生成。

这首“鸿雁三千里,萍蓬七十年。乡情回首处,秋兴正堪怜。”是九歌创作的诗。我们的算法保留了第一句的关键意象——“鸿雁”,忽略了“三千里”。根据《文心雕龙·章句》的启发,如果上文留下的信息过多,反而会干扰模型。“鸿雁”是代表秋天的意象,第一句把“鸿雁”留下来,最后一句就生成“秋兴”,在季节上和意境上连贯,使得整首诗保持了完整的秋天意象。

通过对九歌的研究,我自己对诗歌和文学的理解也更加深入。以前在本科或高中阶段,我只是会去读古人的诗作,最多去看别人的赏析,对整个诗歌理论、文学理论没有探究。读了博士,研究诗歌的智能创作后,我更加系统地来学习诗歌和文学,此间,人文和理工科的内容实现了相互促进、相互驱动。为了要做生成诗歌的任务,就必须去了解诗词相关的知识,这些知识,反过来又有利于指导我们进行模型的设计。这是学科交叉起到的激励作用。

“孤篷一夜笛声中,回首江南万里风;我欲乘槎沧海去,与君同作钓鱼翁。”这是我自己比较喜欢的九歌创作出来的一首诗。机器偶尔确实会有一些让人惊艳的作品,这样的作品其实可以激励人的创作,使人从中得到启发,去提升写作能力。同样,这也激励着我们在人工智能写作领域作出更多的研究和更大的贡献。


(作者:矣晓沅,系清华大学计算机科学与技术系博士生,智能诗歌创作系统九歌开发团队成员,本文由本报记者杨飒采访整理)


相关新闻

  • 232024.04

    岭大国际知名数据科学专家秦泗钊校长膺选欧洲文理科学院院士

    岭大校长兼韦基球数据科学讲座教授秦泗钊教授,膺选为欧洲文理科学院院士(技术与环境科学部)。新院士的就任典礼于2024年4月6日在奥地利举行。岭南大学(岭大)校长兼韦基球数据科学讲座教授秦泗钊教授,膺选为欧洲文理科学院院士(技术与环境科学部),是岭大首位获此殊荣的学者。欧洲文理科学院院长Klaus Mainzer教授对此表示祝贺。这也是继美国国家发明家科学院院士后,秦泗钊教授荣获的另一世界著名科学院院士。新院士的就...

  • 162023.09

    “两种人会师”

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 012022.04

    两种文化之间的生活

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 162021.06

    傅熹年的古典文化世界

    傅熹年的古典文化世界

  • 062019.11

    张履谦88岁学会用微信 一生就做两种事:学习和实践

    张院士大约是在88岁时学会使用微信的。这么大年龄还学新“技能”,张履谦有别于常人。他坦承,一辈子就做两种事:学习和实践。

  • 242021.05

    认识这个世界,是我们人类的天性——高原宁院士的科学世界

    在高原宁看来,认识这个世界,是人类的天性之一。而物理学正好可以帮助我们从不可见到可见,从不可及到可及,从不可知到可知——“有些时候当然会很波折、很艰难,但我依然选择乐观”。

  • 162018.03

    周尧和的魅力世界

    “人才培养的目标,就是要培养一流的、德才兼备的创新型人才。为了达到这个目标,我们就必须坚持教学、科研两条腿走路,共同服务于人才培养这个核心任务。”

  • 192016.03

    世界顶级品牌的管理者 ——清华大学[1999级] 昝晓 访谈纪实

    一个阳光明媚的下午,昝学姐和我们约在了坐落于华贸中心的新光天地,这里是众多国际顶级品牌的聚集地,她建议我们有空时多来逛逛。

  • 212020.07

    专访颜海平:跨文化是近代以来中国和世界始终亟需的能力

    颜海平的个人经历和学术研究都沿着跨文化的脉络延展,其中本科期间创作的历史剧《秦王李世民》、美国任教时期的学术著作《中国现代女性作家与中国革命,1905....

  • 112019.11

    王越炜:科学追梦 文理融通——《方锦清百首诗选》读后感

    近日,得到方锦清教授寄来的诗集,喜不自胜,再一次被他科学追梦的人文情怀所感动。这是方教授近八十年来生活、学习、工作、家庭的生动写照,也是他科学追梦、矢....