欢迎来到北京大学数字人文研究中心!
"北京大学数字人文研究中心"(PKUDH)是北京大学的校级跨学科研究虚体。中心于 2020 年 5 月经北京大学批准成立;2022 年 2 月在北京大学人工智能研究院下设立数字人文研究中心。中心是中国古籍保护协会“古籍智能”专业委员会的牵头组织单位,致力于古籍资源的智能开发与利用。2022 年 3 月接受字节跳动公益的捐赠,以“北京大学-字节跳动数字人文开放实验室”为研发基地,将中心在古籍智能信息处理的技术积累转化为面向大众的公益性社会服务。
数字人文有两方面的含义:大数据和人工智能技术使得在长历史跨度和海量文献资料上的研究成为可能,为人文学科提供了新方法、新工具,催生新范式;另一方面,泛在的数字信息环境更需要人文精神的引领,数字人文是数字与人文相沟通的通道。数字人文要求全科型的人才培养:新一代的人文学者既要具备深厚的人文素养,又要掌握计算思维与数据驱动的研究方法;理工科的学生既要接受系统的科学训练,又要泽被人文精神的熏陶,以此培养智能时代对人类社会和人类命运有整体性思考和把握能力的全科通才。
北大数字人文中心的宗旨是打造数字环境下人文学科发展的信息基础设施,探索智能时代数据驱动的人文研究范式。中心为人文社科学者与理工科专家提供交流与协作渠道,一方面推动大数据、智能技术在人文社科领域的应用,另一方面倡导技术创新要树立以人为本的大局观,促进信息技术与人文社科的双向融合发展。北京大学数字人文中心在校内致力于组织跨学科的研究力量,广泛吸引各院系师生参与,建构协同创新的数字人文平台;在校外积极与国内外高校和相关学术机构建立广泛的学术合作,筹办高端学术活动,培养全科型人才,推动跨学科、跨地域、跨文化的数字人文研究项目。
# 人员构成
# 学术委员会
- 邓小南(主任),北京大学历史学系教授
- 包弼德(Peter K. Bol),哈佛大学东亚语言与文明系讲座教授
- 李晓明,北京大学计算机科学技术系教授
- 朱青生,北京大学历史学系教授
- 荣新江,北京大学历史学系教授
- 刘玉才,北京大学中国语言文学系教授
- 赵白生,北京大学外国语学院世界文学研究所教授
- 罗 新,北京大学历史学系教授
- 李文新,北京大学计算机科学技术系教授
# 工作委员会
# 专家委员会
- 陈 斌,北京大学地球与空间科学学院教授
- 程乐松,北京大学哲学系教授
- 邓志鸿,北京大学智能科学系教授
- 何 晋,北京大学历史学系教授
- 赫忠慧,北京大学体育教研部教授
- 李道新,北京大学艺术学院教授
- 李咏梅,北京大学工学院研究员
- 刘琳琳,北京大学外国语学院日语系副教授
- 罗定生,北京大学智能科学系副教授
- 沙志利,北京大学《儒藏》编纂与研究中心副研究员
- 邵燕君,北京大学中文系长聘副教授
- 宋亚云,北京大学中文系长聘副教授
- 童云海,北京大学智能科学系教授,图书馆副馆长
- 王长松,北京大学城市与环境学院副研究员
- 王腾蛟,北京大学计算机科学技术系教授
- 王彦晶,北京大学哲学系长聘副教授
- 杨海铮,北京大学中文系教授
- 杨 梦,北京大学外国语学院世界文学研究所助理教授
- 杨韶蓉,北京大学《儒藏》编纂与研究中心副研究员
- 叶 炜,北京大学历史学系教授
- 俞敬松,北京大学软件与微电子学院副教授
- 张剑崴,北京大学考古文博学院助理教授
- 张鹏翼,北京大学信息管理系长聘副教授
- 赵丹群,北京大学信息管理系教授
# 什么是数字人文
今日网络化、数字化、智能化的信息环境使得文献资料的生成、传播与处理方式与以往大为不同,造就了全新的学术生态环境,没有任何学科可以置身度外。大数据、人工智能等技术的兴起,改变了传统人文学科分析和处理资料的方法、观察和描述人类行为与社会现象的角度,以及呈现分析结果的形式。置身于这样的颠覆性的学术生态变化,人文学科做出了自己的回应——"数字人文"(Digital Humanities)。作为一个跨学科的研究领域,数字人文的特质在于突破原有的学术藩篱与组织边界,融合文科、理科和技术学科,为多学科的交流与协作提供平台。
数字人文有两方面的含义:大数据和人工智能技术使得在超长时间跨度和海量文献资料上的跨文化研究成为可能,为人文学科提供了新方法、新工具,催生新的研究范式;另一方面,泛在的数字信息环境愈加需要人文精神的引领,数字人文为此提供了通道。数字人文要求全科型的人才培养:新一代的人文学者既要具备深厚的人文素养,又要掌握计算思维与数据驱动的研究方法;理工科的学生既要接受系统的科学训练,又要泽被人文精神的熏陶,以此培养智能时代对人类社会和人类命运有整体性思考和把握能力的全科通才。
# 愿景和目标
北京大学数字人文中心的目标是:
人文计算:
将数字方法应用于人文学科的语料进行跨学科研究,特别是将大数据、人工智能等新兴技术应用在大规模人文语料上进行长历史跨度分析和跨文化比较,为人文学科打造通用的数据工具和计算平台,并借助新技术来呈现人文领域的研究成果。
人文设计:
数字人文为科学与人文的创造性互动提供了一个具体的试验场。它将人文材料以图像、3D 模型、互动应用、虚拟现实等多种形态呈现出来,将人文成果变成互联网信息环境下可感知、可交互的信息产品,激发具有人文气息的文化产品设计,推动数字文化产业发展。
人文创新:
向全校师生开放,师生们可以自由组建跨学科的研究团队,孵化项目想法,开展创新实践。实验室向研究团队提供空间、资源、技术等方面的支持。激发我校师生的活力,释放我校以人文为导向的跨学科研究的巨大潜力。
# 大事记
2025年3月11日,北京大学数字人文中心邀请陈平原教授、孙茂松教授、陈斌教授、李飞跃教授几位在人文研究与人工智能领域的顶尖学者,携手DeepSeek北大校友,举办“跨学科对话——AI挑战下的人文学术 (opens new window)”对谈活动,深度探讨AI时代下人文学术所面临的挑战与危机以及应对方式。
2025年1月12日,召开2024年志愿者大会。
2025年1月10日,召开2024年实习生团建大会。
2024年12月26日,北京日报发表对北大数字人文中心的采访《唤醒古籍》 (opens new window)。
2024年12月20日,“数字与人文节气沙龙”系列活动第38期暨人工智能研究院学术沙龙第十期在百周年纪念讲堂四季庭院举行,沙龙主题为“透视儒释道之心与机器人之心:文明视野下的心灵对望” (opens new window),旨在探讨人类心灵与人工智能之间的深层次对话和相互影响。沙龙由北京大学人工智能研究院副研究员、数字人文与文明演化研究中心执行主任、数字人文研究中心副主任杨浩主讲;北京大学数字人文研究中心主任、人工智能研究院副院长王军主持。
2024年12月5日,清华大学教师发展中心秋季学期系列教学工作坊第8期顺利举办,北京大学数字人文研究中心副主任杨浩老师受邀围绕“AI能否理解思想?——如何运用AI辅助人文研究” (opens new window)作分享,介绍了计算思维在思想史研究中的应用。
2024年12月1日,北大数字人文中心主任王军教授参加第四届中国基础教育论坛历史学科分论坛 (opens new window),并作主题报告《智能技术赋能下的历史教学创新》。
2024年11月19日,北京大学官方公众号报道“‘我是校书官’——大众整理活动”,《䵡 黡 䵤,你认识吗?北大+700余所高校做了一件事》 (opens new window)
2024年10月16日,希腊克里特大学Christophe Roche教授和Maria Papadopoulou助理教授访问北京大学数字人文研究中心 (opens new window)。Christophe Roche教授在克里特大学担任欧洲研究执行局(ERA)社会科学与人文人工智能领域讲席教授。主要研究领域为本体术语学(Ontoterminology)。Maria Papadopoulou教授是克里特大学数字人文与古典语文学助理教授,在希腊化研究和本体论方面做出了深入探索。
2024年10月8日,新加坡南洋理工大学艺术、设计与媒体学院Andrea Nanetti教授率领其团队访问了北京大学数字人文研究中心 (opens new window)。南洋理工大学师生分享了Engineering Historical Memory(工程历史记忆)项目成果,该项目旨在探索工程学在不同历史时期的发展和影响。
2024年9月20日,“‘我是校书官’--古籍大众智能整理计划”第二期 (opens new window)启动。
2024年7月6-8日,北京大学数字人文研究中心举办“北京大学‘数智人文’青年学者实训营” (opens new window)。来自国内外的36名青年学者参加了本次实训营。实训营为期3天,详细深入讲解了人文研究的数智化流程,从问题建模和数据生成开始,到利用R、GIS、SNA等工具进行分析,最后使用AI技术全面辅助人文研究。
2024年7月2日,由全国高等院校古籍整理研究工作委员会主办,北大数字人文研究中心、字节跳动公益承办,联合国内多家古籍研究机构共同发起“‘我是校书官’--古籍大众智能整理计划” (opens new window)。该计划旨在为高校学生提供了解、接触珍贵古籍,参与线上古籍数字化整理的机会,带动广大学子参与古籍整理与优秀传统文化传承。
2024年6月7日,国家古籍保护中心、北京大学数字人文研究中心、抖音公益等多家机构联合举办的“智能时代古籍整理与大众传播”研讨会 (opens new window)在北京大学中关新园顺利召开。此次研讨会汇集了来自国内各大高校、图书馆和出版社的七十余位专家学者。与会学者就智能信息环境下古籍整理与大众传播的机遇与挑战进行了深入交流,分享了智能古籍整理的实践经验,并探讨了古籍走向大众的未来发展趋势。
2024年5月20-25日,国际计算语言学大会 (International Conference on Computational Linguistics,COLING) (opens new window)收录北京大学数字人文中心博士生唐雪梅和段思宇分别作为第一作者的文章 “CHisIEC: An Information Extraction Corpus for Ancient Chinese History”和“Restoring Ancient Ideograph: A Multimodal Multitask Neural Network Approach” 。前者发布了一个中国古代历史文献信息抽取数据集,后者探索了基于多模态多任务神经网络的古代表意文字修复方法。
2024年5月17日,“高校哲学社会科学实验室联盟”成立大会 (opens new window)在北京大学英杰交流中心阳光大厅举行。北京大学数字人文研究中心应邀参与本次活动,中心成员在活动现场向参会嘉宾展示了平台建设成果,并以“吾与点”智能标注平台和“识典古籍”阅读与整理平台为例向参会嘉宾重点介绍了平台开发历程和功能使用,并就相关问题与参会嘉宾进行了深入讨论。
2024年4月22日,大英图书馆亚洲与非洲馆藏负责人孟露夏(Luisa Elena Megoni)带领国际敦煌项目(The International Dunhuang Programme, IDP)团队 (opens new window)访问北大数字人文中心。中心与大英图书馆国际敦煌项目团队就博士生联合培养、敦煌文献数据合作、双边数字人文会议、数字人文联合夏令营等合作项目进行了讨论和展望。双方将进一步加强联系,共同推进亚太地区文化遗产数字化与国际合作。
2024年4月14日,信息资源管理学科顶级期刊Journal of the Association for Information Science and Technology (JASIST) (opens new window)刊登博士生李文琦与王军老师、王凤翔同学合作的研究论文 “Curating the Chinese ancient book catalogs: Leveraging the dual roles of humanities scholars as experts and users in collaborative practice”。
2024年3月11日,伦敦大学亚非学院访问北京大学数字人文研究中心。英方由副校长Adam Habib教授带队,教学副校长Laura Hammod教授、人文学院院长Graeme Earl教授、社会学系Jieyu Liu教授等一行五人来访,数字人文中心主任王军,协同苏祺、杨浩、位通、闫蒲、赖华夏、马大年、宋殷等老师与英方交流了两校数字人文的发展情况,并讨论了未来的合作方向。
2024年3月10日,召开 “智能文献学建设研讨会 (opens new window)”,邀请了来自国内二十余所具有古典文献专业或研究机构设置的骨干教师近40人,中心向大家介绍了“识典古籍”智能文献阅读平台和整理平台,以及“吾与点2.0”智能文献标注平台。大家就智能时代古典文献学的创新发展热烈研讨。
2024年2月21日,Nature 旗下 Humanities and Social Sciences Communications 发表“Evol project: a comprehensive online platform for quantitative analysis of ancient literature” (opens new window)(Jun Wang, Siyu Duan, Binghao Fu, Liangcai Gao & Qi Su)。该文介绍了数字人文中心跨学科团队开发的古文献溯源分析平台原型系统 (opens new window)。在该系统的基础上,数字人文研究中心和王选计算所合作开发了应用级的古文献溯源分析系统 (opens new window)。
2024年1月21日,召开“2023年度古籍智能整理志愿者大会” (opens new window)。本次会议旨在回顾2023年度志愿者团队在数字人文研究方面取得的进展与成果,表彰工作中涌现的优秀志愿者个人,分享志愿者代表在工作中的收获和对未来的展望,并提出对未来一年工作的目标和规划。
2024年1月10日,《人民日报》刊登《数字化,让古籍触手可及》 (opens new window)一文,报道了北京大学数字人文研究中心与抖音合作共建的“识典古籍”平台。
2023年12月9-10日,中心组织全体实验室学生参加“数实共生:预见数字人文未来图景”第五届中国数字人文年会(CDH2023) (opens new window),付炳豪、王凤翔等同学撰写的两篇论文入选并作报告;北京大学数字人文研究中心开发的三个项目分别斩获最佳项目奖、最佳技术奖与优秀平台奖。
2023年11月3-4日,举办“智能时代的人文研究与教育”国际研讨会 (opens new window)。来自国内外二十多所院校和机构的学者共聚一堂,讨论智能信息环境下人文学科的发展机遇,分享数字人文的教学成果和理念,探讨全球课程共建机制。
2023年11月2日,哈佛大学燕京图书馆访问北京大学数字人文研究中心 (opens new window)。哈佛大学燕京图书馆杨继东馆长代表燕京图书馆向北京大学数字人文中心捐赠了该馆已经完成的中国善本古籍数字化扫描书影。
2023年9月20-22日,雅典大学中希文明互鉴中心访问北京大学数字人文研究中心 (opens new window)。
2023年9月14-17日,北京大学数字人文研究中心参加2023年中国图书馆年会及展览会分会“数字人文+Open GLAM” (opens new window)。王军老师在会上做了 “大模型时代的智能文献学” 的主题报告,重点介绍了中心自主研发的数字人文平台“吾与点智能标注平台”和“文献溯源分析平台”。
2023年7月30-8月12,北京大学数字人文研究中心、历史学系、人工智能研究院与哈佛大学费正清中国研究中心数字中国研究计划,以及普林斯顿大学东亚学系联合举办“智能信息环境下的人文创新”数字人文暑期工作坊 (opens new window)。
2023年6月9日,Nature 旗下 Humanities and Social Sciences Communications 发表 “Disentangling the cultural evolution of ancient China: a digital humanities perspective” (opens new window)(Siyu Duan, Jun Wang, Hao Yang & Qi Su)。该文应用深度神经网络在数据集上遍历计算数千万的相似互文对,随后使用一个层次框架将相关文献组织起来构建文献互文网络。基于该网络的节点特征,计算任意两部文献之间的标准化互文分数作为检验各类文化现象的依据。
2023年2月8日,在国家图书馆正式发布由国家图书馆、北京大学和字节跳动公司合作推出的“国家古籍数字化工程”优秀项目——“《永乐大典》高清影像数据库”及“《国家珍贵古籍名录》知识库” (opens new window)。
2022年11月,发布《经籍指掌——中国历代典籍目录分析系统》 (opens new window)。该平台是由北京大学数字人文研究中心与中国科学院自然科学史研究所联合研发的一套针对中国历代典籍目录之间类书与书目之间关系的可视化分析系统。系统对历朝史志目录、《四库全书总目》、《中国古籍总目》等九种代表性官修目录的数据进行标准化处理与书目认同,并利用可视化手段对各目录之间的关系进行呈现。
2022年10月14-16日,北京大学数字人文研究中心硕士生邓泽琨同学撰写的论文《数字人文视角下的〈史记〉〈汉书〉比较研究》 (opens new window)入选第二十一届中国计算语言学大会(The 21st China National Conference on Computational Linguistics, CCL 2022)。
2022年10月,“北京大学-字节跳动开放实验室”研发的“识典古籍”智能古籍阅读平台 (opens new window)上线。
2022年7月18-30日,北京大学数字人文研究中心和人工智能研究院联合举办了2022 数字人文暑期工作坊。工作坊共收到来自国内外二百余所高校和研究机构的近千份报名和咨询邮件,覆盖了一百余门类学科,录取学员 68 人。
2022年3月17-4月10日,北京大学首届“北京大学数字人文作品展” (opens new window)在北大全球大学生创新创业中心开幕,展出的数字人文作品来自校内文科、社科、理科、工科等 20 多个单位,主题涉及古典文献、课程创新、历史地理、社科计算等领域,展示出北大在学科交叉和原始创新方面的巨大潜力和蓬勃动力。
2022年3月17日,中心接受字节跳动公益的捐赠,冠名成立“北京大学-字节跳动数字人文开放实验室” (opens new window),致力于古籍资源的智能开发与利用。
2022年3月12日,在高校古委会和古保协会的支持下,由数字人文中心发起并筹备的“古籍智能系列在线研讨会” (opens new window)正式启动,研讨会组织古典文献领域的资深学者、信息技术领域专家和古籍数字化领域的企业领袖共同研讨古籍资源智能开发与利用的相关议题。系列研讨会共有 10 讲,覆盖全年。
2022年2月24日,北京大学数字人文研究中心唐雪梅同学论文“That Slepen Al the Nyght with Open Ye! Cross-era Sequence Segmentation with Switch-memory” (opens new window)被2022年国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics, ACL2022) 主会录用,该论文也是首篇在自然语言处理国际顶级会议中以古汉语分词为研究任务的文章。
2022年1月13日,北京大学数字人文研究中心主办、北京大学文化产业研究院和北京大学文化传承与创新研究院联合承办“文化遗产与文化计算”学术沙龙活动 (opens new window)。
2021年12月30日,在北京大学校长办公会上通过为数字人文研究中心配置基本资源的决议。
2021年11月16日,古籍智能开发与利用专业委员会 (opens new window)成立,北京大学信息管理系教授、北京大学数字人文研究中心主任王军担任主任委员。
2021年8月10日,数字人文研究专题工作会议在燕园大厦1211会议室举行,通过促进数字人文中心实体化建设的决议。
2021年6月16日,在北京大学行政月度会上汇报 “北京大学数字人文发展规划倡议”。
2021年5月16日,在北京大学校长办公会上汇报北京大学数字人文进展及发展规划。
2021年1月14日,举办 “智慧人文的探索与实践”研讨会暨北京大学数字人文研究中心成立仪式 (opens new window)。
2021年1月1日,北京大学数字人文研究中心(PKUDH) 和 哈佛大学费正清中国研究中心(FCCS) 达成全面合作协议 (opens new window)。
2020年12月1-4日,北京大学数字人文中心的四篇研究论文被第十一届「数位典藏与数位人文国际研讨会」 (opens new window)接收,分别是杨浩《基于概念共现聚类方法分析<论语>中仁与礼的关系》,王林旭《基于宋元明清儒学史的学术谱系研究》,王凤翔《基于知识图谱的<论语>可视化系统设计与构建》,陈诺、卞恩华等《面向用户需求的CBDB在线查询系统设计与实现》。
2020年11月,北京大学数字人文研究中心与哈佛大学费正清中国研究中心联合申请的国家自然科学基金重点国际合作项目"中国儒家学术史知识图谱构建研究" (opens new window)获得资助。
2020年10月19-21日,第二届全国数字人文年会(DH2020) (opens new window)在上海举行。北京大学数字人文中心研发的 “面向用户需求的 CBDB 在线查询系统设计与实现” 与 “《宋元学案》知识图谱” 项目在获得最佳项目奖。
2020年9月25日,参加智能时代古籍资源开发与利用研讨会 (opens new window),北京大学数字人文研究中心承担了其中的 “古籍数字化关键技术创新与应用研究”子课题。
2020年8月,2020年“数字图书馆联合会议” (JCDL2020) (opens new window)和2020年国际数字人文大会(DH2020) (opens new window)收录数字人文实验室的多篇研究成果,包括:刘姝然同学的 “How to Organize Digital Tools to Help Scholars in Digital Humanities Research?”,张力元和杨海慈合作的 “Can Digital Humanities Help in Finding Research Questions?” 以及李晓煜、王林旭、刘姝然、卞恩华、陈诺等人合作的 “A Visualization-Assisted Reading System for a Neo-Confucian Canon”。
2020年6月6日,在“北京论坛”的支持下,北京大学数字人文研究中心(筹)联合北京大学人文社会科学研究院、北京大学历史学系举办“数字人文视角下的中国历史研究”国际汉学云端论坛 (opens new window)。邀请北京大学邓小南教授、哈佛大学包弼德教授(Peter K. Bol)、德国马克斯-普朗克研究所薛凤教授(Dagmar Schäfer)、荷兰莱顿大学魏希德教授(Hilde De Weerdt)、台湾中研院历史语言研究所陈熙远教授等学者参加。
2020年5月8日,举办北京大学数字人文工作坊“数字与文学的对话:数字人文范式对传统文学研究方法的挑战” (opens new window)。全文纪要刊发于《中国现代文学研究丛刊》2020年第8期。
2020年4月18-5月23日,举办“北京大学数字人文工作坊” (opens new window) 。工作坊共分为两部分:第一部分为专家授课,邀请德国马克斯-普朗克研究所、德国柏林国家图书馆、台湾大学和北京大学共六位领域专家讲授数字人文工具与应用实践;第二部分为学员分享,由北京大学和香港大学的三位学员报名分享其在数字人文领域的研究经验。本届工作坊全程采用线上教学与互动方式,总计有来自海内外各院校和机构的约1500人次参加课程。
2020年3月20-29日,筹建中的北京大学数字人文研究中心(筹)与北京大学图书馆通力合作,推出“人文学科电子资源与数字人文导航”系列在线直播讲座 (opens new window)。
2020年1月16日,由北京大学社会科学部主办、北京大学数字人文研究中心(筹)召集,主题为“人工智能时代人文学科的挑战与机遇”的北京大学数字人文建设与发展专题研讨会 (opens new window)。
2019年12月17日,举办北京大学-哈佛大学数字人文合作研讨会 (opens new window)。哈佛大学费正清中国研究中心的包弼德教授、陈松老师、王宏甦老师访问北京大学信息管理系,与来自北京大学历史学系、北京大学信息管理系、北京大学数字人文研究中心筹建小组的九位老师就“北京大学与哈佛大学在数字人文领域的合作路径”展开讨论。
2019年10月13日,北京大学文研院举办“数字人文视角下的典籍传承与学科融合”研讨会。
# 加入我们
北京大学数字人文中心为数字人文领域的创新与发展提供开放且包容的环境,欢迎校内外对数字人文有兴趣的老师和同学加入数字人文的人才资源库。有相关活动或适合的项目时,将联系当事人参加中心的活动,或组建跨学科的研究团队。
报名方式:
请您撰写个人陈述,连同您的简历一同发送至 gdhc@pku.edu.cn 邮箱。中心研究员招募方式滚动招募,无截止日期。
# 联系我们
地址: 北京市海淀区海淀路 50 号北京大学资源东楼
邮箱: gdhc@pku.edu.cn
公众号: 数字人文开放实验室