“2023年中国数字人文年会”参会记
2023年12月16日
2023年12月9日至10日,由中国索引学会指导,武汉大学信息管理学院与中国索引学会数字人文专业委员会主办,武汉大学文化遗产智能计算实验室、大数据研究院、信息资源研究中心承办的“数实共生:预见数字人文未来图景”第五届中国数字人文年会(CDH2023)在武汉隆重举行。
本次年会吸引了国内外重要数字人文学者,共同探讨数字人文的未来发展。CDH2023汇聚了来自信息管理、历史、文学、艺术、计算机、人工智能等多个学科领域的近500名参会者,涵盖了图书馆、档案馆、博物馆、出版社和文化科技公司等机构代表,设置了包括智慧数据、数字出版、古籍活化、文化遗产数字化、人工智能与数字游戏,以及语言文学、音乐艺术、历史考古等10个分论坛,为参与者提供了广泛、深入地开展学术交流的平台。
本次盛会,王军老师组织北京大学数字人文中心全体学生参会。实验室由位通老师带队,博士生王林旭、唐雪梅、段思宇、王凤翔、付炳豪、高源,硕士生邓泽琨、田雨娇等八名同学组队参加。付炳豪、王凤翔等同学撰写的两篇论文入选,二人在年会上进行了报告;北大数字人文中心开发的三个项目分别斩获最佳项目奖、最佳技术奖与优秀平台奖。
# Part 1
#
北京大学数字人文中心主任王军教授在“数字人文与智慧数据”分论坛中以 “吾与点2.0——智慧数据的智能生成” 为题进行了主旨报告。他从人工智能蓬勃发展的里程碑——ImageNet开始,强调了“数据”的重要作用,并介绍了智慧数据的意义和不同类型。王军教授随后重点介绍了北京大学数字人文中心最新推出的AI 驱动云端智能标注平台——吾与点智能标注平台,并现场演示了在该平台上进行古文本、现代文文本和英文文本的结构识别、全文编辑、实体标注、关系标注和图谱生成的操作过程。王军教授精彩的报告吸引了众多与会者的积极响应,现场座无虚席。参会者们的热切关注突显了吾与点智能标注平台在数字人文与智慧数据领域引发的广泛关注,及其对相关研究和应用的启发作用。
# Part 2
#
该论文是在北京大学数字人文研究中心自研数据可视化平台 “经籍指掌——中国历代目录分析系统” 的基础上开展的研究性工作。论文发问于目录之学的传统功用,提出以量化的方法实践“辨章学术,考镜源流”的根本目标,落脚于用集合论形式化定义体现目录的书籍流传现象,并通过对书目存在时空的向量化自动发现书籍或书群的流传轨迹,以此推知历代知识结果的变迁过程。点评专家表示,该论文使用完全量化的方法回答经典的目录学问题,是一项具创新性的研究成果。
# Part 3
#
该论文介绍了北京大学数字人文研究中心自研的 "古文献分析平台" 的原理和实现方法。此平台以大规模中国古代哲学经典著作为研究对象,运用自动分词、复用检测识别等处理方式,并采用多层次、多视角的统计与可视化方法来对古籍文本进行深层次挖掘,可辅助人文学者在多层次语义单元上分析思想文化的演变历程。点评专家表示,该论文使用了最新的语义相似度技术来进行文本溯源,是一项创新性很强的工作,并对数字人文研究产生很大帮助,后续可考虑在更大规模、更多样化的数据上展开研究。
# Part 4
#
#
中心研发的 “《国家珍贵古籍名录》数字平台” 项目获得本届年会“最佳项目奖”。《国家珍贵古籍名录》是我国百项重大工程之一的“中华古籍保护计划”的重要成果。北京大学数字人文中心在国家图书馆的数据支持下,通过交互式可视化与关联语义技术实现了对《国家珍贵古籍名录》收录的13026部古籍的多维度查询与探索。平台包括名录介绍、名录浏览、名录分析三个部分。该平台一方面为大众打造了一种了解、阅读、探索存世珍贵古籍的全新体验;另一方面,也为专业用户提供了语义化、知识化分析和研究的工具,以助力学术研究。
(“《国家珍贵古籍名录》数字平台 ”访问地址:https://rarebib.pkudh.org/ (opens new window))。
# Part 5
#
#
“吾与点智能标注平台” 项目获得本届年会“最佳技术奖”。吾与点是北京大学数字人文中心针对古籍文本推出的 AI 驱动云端智能标注平台。该平台主要包括三项特色功能:实体标注功能支持手动、正则匹配、AI 识别三种实体标注模式,能够快速准确标注古籍文本中的实体,用户无需繁琐操作就能轻松应对大规模文本;关系标注功能支持手动和AI识别两种标注模式,可以精准捕捉古籍文本中实体间的复杂关系;图谱生成功能可以自动将标注的实体和关系转化为清晰的知识图谱,一键输出,支持多种常用工具格式。目前,该平台不仅适用于古汉语文本,也可适用于现代汉语、英语等多语言文本。
(“吾与点智能标注平台”访问地址:https://wyd.pkudh.net/ (opens new window))。
# Part 6
#
#
“文献分析平台” 项目获得本届年会“优秀平台奖”。"文献分析平台"是北京大学数字人文中心自主研发的一款面向人文研究的智能分析工具。该平台荟萃二百余部中国古代哲学经典著作的全文数据,主要包含三个功能:词汇统计分析,即对古籍文本中的词汇频次、共现情况等进行全面的梳理,以确定古籍中的重要概念和主题;句子复用分析,追溯句子的来龙去脉,从历时性角度观察句意相似的句子在形式和内涵上发生了什么样的变化;书籍分析,检索和查看古籍图书,实现对书籍概况、篇章和正文中的句子进行分析,并支持全文阅读。
(“文献分析平台”访问地址:https://ca.pkudh.net/ (opens new window))
# 总结
北京大学数字人文中心的同学们在大会期间和国内数字人文领域的师生广泛交流,收获颇丰。回到北大后,实验室全体师生共同交流参会心得,分享参加各个分论坛的收获。在此基础上,实验室成员进一步明确了未来的研究计划和研究方向。北京大学数字人文中心将继续在数字人文教育和研究的道路上努力前行,为智能时代的文化的传承与创新贡献自己的力量。
中国数字人文年会作为我国数字人文领域的最具影响力的年度学术盛事,于2023年的武汉再次展现了其独特价值和引领地位。本次会议以数字化时代中国优秀传统文化焕活新生为中心,通过深入研讨和精彩交流,呈现了中国数字人文研究的新进展、新突破、新成就。衷心感谢王晓光老师领导的武汉大学数字人文团队筹备大会的辛勤付出!