2023年9月6日下午,我院邀请中国科学院自然科学史研究所孙显斌研究员作李迪科技史论坛第72期讲座“古籍数据库建设实践与思考”。讲座由我院董杰教授主持,我院40余位师生参加了报告会。
孙显斌研究员是古籍数字化和知识库建设领域的专家,他拥有北京大学中文系古典文献学博士和计算机软件专业学士的双学位,现任中国科学院自然科学史研究所研究员,同时也是中国古籍保护协会古籍智能开发与利用专业委员会委员、北京大学数字人文中心兼职研究员,“中国科技典籍选刊”联合主编。他在古籍整理和研究方面有着丰富的经验和成果,出版了《<汉书>颜师古注研究》《攻玉集》等专著,整理了《王祯农书》《物理小识》等古代科技典籍,参与开发了“资治通鉴分析平台”“中国历代典籍目录数据集成与分析系统”等知识库系统。
讲座内容涉及了古籍数字化的发展历程、现状和挑战,以及孙显斌研究员参与的几个具有代表性的古籍知识库建设项目,如资治通鉴分析平台、历代典籍目录分析系统、中华寻根网等。孙显斌研究员从三个层次阐述了古籍数字化的过程,即图像化、全文化和知识化,并指出随着大数据和人工智能技术的应用,图像化和全文化已经实现了质的飞跃,而知识化则是未来的发展方向。他还介绍了一些人工智能技术在古籍整理和研究中的应用实例,如古籍OCR技术、自动句读标点、命名实体标记等,并展示了一个基于人工智能技术和知识库思想的古籍整理研究智能化平台架构。最后,他提出了进一步推进理论化、工程化,建设基础设施的设想,以及对人文研究是否面临信息时代挑战的看法。
孙显斌研究员的讲座引人入胜,为我院师生提供了一个难得的学习机会,使师生获益匪浅。讲座结束后,孙显斌研究员还与多位师生进行了互动交流,并耐心细致地回答了他们提出的问题。这次讲座不仅为我院在古籍数字化和知识库建设领域的研究提供了新的思路和启发,也为我院在这一领域的教学和科研工作注入了新的活力。