百年清华

数字让人文更新

2022-05-23 | 文/刘石 孙茂松 | 来源 《中华读书报》公号2022-05-21 |

刘石(右),清华大学人文学院教授;孙茂松,清华大学计算机科学与技术系教授

日前,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,共五个方面18条,内容全面,要求明确,指导性强,鼓舞人心。对于我们来说,其中的第12条:推进古籍数字化。建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享。支持古籍数字化重点单位做强做优,加强古籍数字化资源管理和开放共享。统筹古籍数字化版本资源建设与服务,推进古籍专业数据库开发与利用。积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。”特别让人感到振奋。

计算机科学的发展使得大数据时代不期然而至。中国大陆古籍数字化已有30年左右的历史,但相对于20万种现存中国古籍来说,得到数字化的古籍尚属很小一部分,这项工作在今后相当长时间内仍当是亟待加强的工作。《意见》提出的建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程,正当其时,非常重要,希望有关部门能够以此为契机,抓紧落实。

技术的发展,倒逼我们提出更高和更激荡人心的目标。随着计算机深度学习能力、文本挖掘等大数据技术和人工智能的快速发展,我们应该在继续推进古籍数字化的同时,呼吁古籍由数字化向知识化转变。这也正是上引第12条最后两句积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级所表达的内容。它充分体现了《意见》对于古籍数字化领域发展前沿的深刻把握,对于利用现代科技手段促进古籍整理与研究的高度关切,具有极为重要的前瞻性和方向性,值得我们重视。

数字化和知识化的最大区别,就是前者仅可提供简单的字词检索,后者则是基于现存所有存世古籍的关系性、结构化、知识再生型的超大数据库。几年以来,我们已在构想建立“中国古典知识库”。所谓“中国古典知识库”,简单地说,就是运用计算语言学和自然语言处理前沿技术,开发适合不同古籍类型的文本分析模型和工具,实现针对古籍文本的词汇抽取、分词和关联分析;使用人工智能、大数据、自然语言处理等相应的技术工具和手段,借助过往一切古典学的研究成果,周密地设定主题词表,专业地提取各种实体,如年代、地名、人名、书名、篇名、职官、社团、思潮、事件以及各类语言和文化要素,多维度地构建不同实体间的关系,并通过这些实体及相互关系,在保障古籍文献内容完整性及内部逻辑性的基础上突破文献原有结构,对文献进行深层组织和知识管理,构建为体系化的“中国古典知识库”(Chinese Classics Knowledge Base,简称CCKB)。

“中国古典知识库”是关乎中国古典知识整体的宏大构想。它的建设,有望给与古代文化研究相关的众多学科带来决定性变化。这些变化,《意见》表述为“古籍整理利用转型升级”,可谓言简意赅。首先是古籍整理的转型升级。大数据技术引发了传统文献生产的创革、文本形态的新变和文献获取方式的拓展;其次是古籍利用的转型升级。碎片化、标准化、结构化、关系化与可视化的古典知识库,可以知识结点为单位组织信息,以链接方式表达特定联系,随时根据需要组成非线性网状结构的各种文本集、数据库等“宏文本”或“超文本”,最大程度地促进了文献的关联与知识的再发现。网络分析、文献计量、主题模型等文本信息技术的应用提升了人文学术的整体性、实证性、求是性与科学性,从根本上促进了传统文献学的现代转型。

现在国外的某些名校已经在开展局部的中国古典知识库的工作了(比如哈佛大学“中国历代人物传记资料库,简称CBDB”)。因之,它的建设不仅关乎古籍整理和中国传统文化研究的推进,也关乎我国的信息安全和文化自信,我们应该意识到这件工作的重要性和紧迫性。

数字让人文更新。这一宏大构想不是一个机构或少量人员在短时间能够完成,它需要国家将之真正上升到文化发展战略高度,相关职能部门高度重视,给予规划和指导;需要专业力量和技术力量的通力合作,需要多个高校或科研机构、企业合作完成。现在,我们十分高兴地看到《意见》就此提出了明确的期望和要求,相信此项工作能够尽早提上议事日程。


相关新闻

  • 162021.06

    吴晨:十余年一直为复兴北京的美好而努力

    生于北京、长于北京的吴晨(2000级博,建筑),对林语堂的这段描述印象很深,“北京真的很美好。”吴晨感叹着,这里的过去,留下了深厚而绚烂的积淀;这里的未来,也孕育着无限的机遇和可能。最近十余年,这位曾获得过业界殊荣的建筑师,一直在为复兴北京的美好努力着。

  • 132023.02

    守正创新 踔厉奋发 努力开创清华校友工作高质量发展新局面——清华校友总会第八届理事会工作报告

    如果您无法在线浏览此 PDF 文件,则可以下载免费小巧的 福昕(Foxit) PDF 阅读器,安装后即可在线浏览 或下载免费的 Adobe Reader PDF 阅读器,安装后即可在线浏览 或下载此 PDF 文

  • 172018.01

    单霁翔:弘扬传统文化任重道远

    作为中国最大的古代文化艺术博物馆和举世闻名的世界文化遗产,故宫博物院近几年在文物保护利用、文化遗产保护传承上开拓创新,成绩斐然。近日,本报微信公众号“....

  • 042024.06

    专家访谈︱张其锟:扩展新技术在城市规划中的应用

    张其锟,出生于1928年9月,现年96岁,清华大学土木系毕业,教授级高工,享受国务院政府特殊津贴。曾任北京市计算中心主任、北京市城市规划委员会副主任、北京市城市规划设计研究院副院长等职,正局级离休干部。1983年,张院长主持负责了北京首次航空遥感综合调查“8301工程”总体设计和实施工作,并于1987年获得国家科技进步一等奖、北京市科技进步特等奖,1988年被人事部评为国家有突出贡献专家、北京市有突出贡献专家,2001年获中国城市规划协会“全国城市规划行业资深规划工作者贡献奖”。

  • 232024.05

    香港岭大校长秦泗钊:教育要跟上时代,掌握AI而非被取代

    我觉得作为校长主要的要求和素质,不应该是受欢迎的“网红”,而应该是一位教育家,这是非常重要的。办大学,是教育家做的事情。每年这么多大学毕业生,如何让这些人成为社会有效的组成部分?学校应该允许学生使用人工智能,有利于学生以后适应职场的需要,但写论文或者发表更专业的东西,还是要训练职业操守。经典需要传承,技能类的课程则要与时俱进革新。大学不应该教过时的技能,要对学生负责。“终身教职”制度具有两面性,不能只盯着“非升即走”。香港高校应保持特色,区别于内地大学,社会对人才的需求应该是多样化的。

  • 092016.05

    王众托院士:埋头创新 不刻意追问成果大小

    王众托,1928年出生于北京,1951年毕业于清华大学电机系,毕业后即到大连工学院电机系工作。

  • 272021.04

    为母校建设添砖加瓦 | 清华校友教室捐赠揭牌仪式暨清华校友支持项目发布仪式举行

    4月24日,清华校友教室捐赠揭牌仪式暨清华校友支持项目发布仪式在三教举行。清华大学副校长、教务长、教育基金会理事长杨斌,校务委员会副主任、校友总会副会长史宗恺,副教务长、教务处处长曾嵘,校友工作办公室主任、校友总会秘书长唐杰,注册中心主任尹佳,教育基金会副秘书长孙大鹏,周华学长(1974级建工)等六十余位捐赠校友代表出席了仪式。发布仪式由唐杰主持。

  • 032007.07
  • 202010.04

    清华大学百年校庆第一批认捐启事

    清华大学百年校庆第一批认捐启事2011年,清华大学即将迎来百年华诞。

  • 022009.06