1月3日,国家社科项目“基于数据驱动的资源发现平台研究”课题沙龙在经济与管理学院法商南楼418会议室举行。上海图书馆学会学术委员会主任金武刚教授,信息管理系蔚海燕老师,周亚老师以及项目组的人员与多位研究生同学参与研讨,对课题的进一步开展提出了诸多建设性意见。
首先由项目负责人王仁武老师对课题开题以来的工作进展情况进行了汇报,该项目课题基于资源发现系统进行3个方面的重点研究,分别是整合开放数据和多媒体资源,用户日志行为的分析以及资源发现的语义检索方法的应用。项目从2016年开题以来到现在已经完成资源发现系统中用户日志以及用户信息的收集,开放数据的调研,相关技术的准备。当前项目的工作重点是资源发现系统中的各类资源整合,首先是开放数据的整合。在这一部分,已经完成对国内外开放数据的调查研究,在此基础之上选择标准较高,评分靠前的台湾地区、香港地区、上海市、青岛市的政府开放数据,研究整合到资源发现平台的仿真检索实验研究。当前研究的难点在于国内政府开放数据提供的元数据内容较少,与开放数据元数据标准相关的参考资料甚少,并且很多的数据无法达到五星级以上的标准,为此项目组接下来将通过与相关机构的合作交流来解决这一问题。与此同时开展的有多媒体资源(图像,影音)的整合研究,首先是进行资源的人工标引,然后通过机器学习实现自动识别多媒体资源。
金武刚教授对该项目表示了浓厚的兴趣,对于目前开展的工作给予了极大的肯定并表示该项目有着十分重要的长期研究的价值。同时提出可以通过校际(比如上海交通大学,复旦大学等)间以及上海图书馆的共同合作来扩大该项目的学术影响力。
蔚海燕老师重点对于资源发现系统用户日志行为分析这一部分的工作提出了几点建设性的意见。即是否可以将资源发现系统中获取的用户行为信息和学者的学术产出进行关联,由此可以建立一个学术产出的预测模型,从而获取更大的研究价值。
周亚老师则提到了目前已经存在的和项目相关的一些研究机构,比如说复旦大学已经拥有实现部分开放数据整合的平台,中信所创建的人才网整合了不同领域的专家的信息和学术成果。这些对于项目之后的研究工作有着极大的参考价值。
项目负责人在介绍项目研究工作过程中,项目得到了学校图书馆于亚秀老师和学校网络信息中心冯骐老师的极大支持,使得项目组对学术资源用户对学校已有的各类学术资源的访问使用情况等用户行为的数据的采集处理能够顺利进行下去。