2019年12月19日下午,我校终身教授学术报告会第12场在中文系4405教室顺利举行。中文系刘志基教授以“面向智能化研究的古文字资料分析整理”为话题,为我们带来了一场精彩的学术报告,师生约40人参加,并有幸请来上海师范大学徐时仪教授对本场报告进行点评。
刘志基教授谈“面向智能化研究的古文字资料分析整理”
刘志基教授首先以古文字数字化研究的其中一点不足即图像输入缺少识别信息为切入点,展开对当前智能化古文字研究的资料如何展开的问题进行了讨论。
刘志基教授指出,面向智能化研究的古文字资料处理,就是要通过分析整理资料来让计算机来识别所有材料的所有方面和所有层次。当前应该做些什么,怎么做,应该至少有如下几点:
第一,古文字资料图像的再处理工作。在智能化研究的模式下,目前的古文字图像的数量和精读远达不到数字化研究的要求,成为了古文字研究的短板,古文字资料的处理工作既需要大面积的补缺,也需要全方位的返工。
第二,字形的分类整理工作。字形是古文字研究永恒的基本对象。智能化手段的开发,给文字构形以新的处理任务。传统文字构形的研究为适应智能化研究的高效手段,需要更加细致地进行分类整理工作,使分类整理的广度包含所有方面,深度包含所有层次。较为可行的即是基于传统构形研究的认知来进行的,如异体、异写、笔迹、偏旁、书体演变等等不同角度的构形分类工作。刘志基教授针对以上几个要点进行了详细的阐述,并指出具体的智能化研究,应根据不同的研究目标,对应不同分类层次的大数据展开,比如甲骨文的字体研究应主要借助“笔迹”层面展开,而金文则应主要借助于“异写”的层面。
第三,成系统的义类分析整理。刘志基教授指出,目前还缺失一种直接凸显古文字文献材料义类大数据的穷尽式整理成果,他举例介绍了义类分析整理的独特价值,并指出从义类角度的大数据挖掘具有无限可能性。
第四,考释研究成果的分析整理。限于传播条件的局限,以往这类工作的成效是相当有限的。刘志基教授指出,考释资料要成为智能化研究的资源,需要完成自身的数字化转化,还要与被考释对象进行数字化方式的关联,其中的难点是古文字字体建设。他还以华东师大文字中心的数字化成果《古文字考释提要总览》为例,讨论了对考释成果进行智能化整理的几个要点,如锁定被释的对象,收入字释以外的的其他考释意见,等等。
最后,刘志基教授指出了重建古文字资料系统的策略,强调这实际上是再造古文字资料系统,这么浩大的工作要区别轻重缓急,分阶段逐步落实,还要总结经验教训,优化工作策略。他详细总结了重建古文字资料系统的几个重点,如要以智能化手段助力资料处理,要形成社会共建机制,需要传统古文字研究界加大投入力度,等等。
徐时仪教授对本次讲座做了点评。他首先肯定了刘志基教授多年来的数字化研究的成就,重点对讲座中谈到的古文字图像的整理和考释成果数字化的观点表示赞同和支持,他以自己研究古汉语的经验为例,指出图像整理的重要作用,肯定数字化手段对词汇文字研究的促进作用,并针对义类系统的整理提出了自己的观点。徐时仪教授最后提出两个建议,一是古文字智能化可以向历史文化研究的方向开展,二是可以利用数字化的手段向语言研究的深层如古文字的源头开展。
最后提问阶段,几位同学分别提出了考释成果检索的问题,残缺金文文字识别问题等,刘志基教授对这几个问题一一作了解答。
供稿|中文系 编审|史玉洁