首页 >> 图书情报学 >> 情报学
“数据即服务”背景下图书情报机构科学数据服务的发展机遇
2018年04月19日 09:32 来源:《情报学报》 作者:杨国立 周鑫 字号
2018年04月19日 09:32
来源:《情报学报》 作者:杨国立 周鑫
关键词:数据即服务;科学数据服务;大数据;云计算

内容摘要:数据即服务(DaaS)背景下,图书情报机构科学数据服务获得了良好的发展机遇。

关键词:数据即服务;科学数据服务;大数据;云计算

作者简介:

  作者简介:杨国立(1979- ),男,在读博士研究生,江苏大学图书馆副研究馆员。镇江 212013,江苏省数据工程与知识服务重点实验室,E-mail:yanggl@ujs.edu.cn。南京 210023;周鑫(1989- ),男,南京大学信息管理学院在读博士研究生。南京 210023,江苏省数据工程与知识服务重点实验室,主要研究领域为信息分析与科学计量、信息经济学。南京 210023

  内容提要:数据即服务(DaaS)背景下,图书情报机构科学数据服务获得了良好的发展机遇。在数据组织方面,重视面向全方位的数据组织;在服务模式方面,实现按需服务,并构建全范围的开放研究服务平台;在服务推广方面,开展服务营销占领科学数据服务市场;在服务体系方面,促进科学数据服务生态系统的进化;在管理规划设计方面,加强制度建设、重视源数据管理、借助现代数据管理技术、科学设计服务应用模式和注重风险管理;在人才方面,推动馆员向数据科学家转型。

  关 键 词:数据即服务 科学数据服务 大数据 云计算

  标题注释:国家社会科学基金项目“图书馆知识发现服务的功能定位和建设策略研究”(14BTQ018)。

  1 引言

  从历史维度上看,服务重组贯穿了图书情报事业发展的整个过程,但早期的重组对用户影响并不深入。步入互联网和知识经济时代,以互联网为载体开展的信息和知识服务一定程度上改善了这种局面。大数据时代来临,数据密集型科研范式下,数据对于科研的基础支撑作用日益显著,互联网作为一种宏观背景甚至在直观意识上已被忽略,用户更加关注的是大数据。一向“以用户为中心”的图书情报机构也迅速成为科学数据服务的推进者甚至主导者。这次面向科学数据服务的重组对用户造成了更为深刻的影响:基于图书馆馆藏资源而进行的科学数据开发服务、通过自建硬件环境而开展的科学数据存储服务、科学数据检索与导航服务、嵌入式科学数据管理咨询服务和科学数据分析与再加工服务[1]等一系列服务,试图为科研工作者数据获取、咨询与分析提供有力支撑。然而,科学数据服务推进过程中所暴露出的缺陷日益突出:数据资源不够全面、硬件基础设施建设代价昂贵、数据长期保存面临挑战、科学数据系统之间的互操作性差[2]、服务过程中的管理不够完善等诸多问题,阻碍了科学数据利用价值的深入挖掘,甚至威胁着数据利用的安全,从而导致科学数据服务之于用户的吸引力并未如事先预想的那么强大。事实证明,用户并不容易被影响,用户的服务需求十分直接并不断进行着动态升级,科学数据服务只有直接面向用户的真实科研需求,并通过动态跟踪和迭代升级来满足他们不断变化的服务需求,才能逐渐树立起自身在用户中的影响力。与此同时,市场上数据服务机构不断涌现,对图书情报机构造成了巨大威胁。压力与挑战并存的同时,也给图书情报机构带来了新的发展机遇,图书情报机构必须借助大数据和云计算,转变原有科学数据服务中对数据组织、服务功能、服务推广、技术应用以及服务管理的认识,重新构建科学数据服务模式,使压力成为动力、将挑战变成机遇。笔者试图通过对新型科学数据服务的理论架构,揭示科学数据服务实践中可能涉及的关键要素和变量及其之间的关系,提供具有前瞻性和回顾性特征的策略性、整体化、可持续性和可拓展性的方法和工具包,为科学数据服务搭建中的能力需求、资源需求以及控制、管理提供逻辑线索,从而助力图书情报机构莫失良机。

  2 相关研究分析

  20世纪80年代以来,学术图书馆的数据服务就一直受到学者关注,尤其是社会科学领域的参考服务[3]。在科学数据最初可以以数字化格式大量获取时,图书馆员便积极学习数据收集和机器可读编目相关知识和技能,以期帮助用户发现和获取数据。几乎与此同时,图书情报界开发了不少数据服务模式。21世纪初,科学数据服务主要局限于数据收集和编目服务。在科研环境、用户需求、信息技术交互影响下,科学数据服务内容不断拓展。总体上,科学数据服务研究包括理论分析和实践调研两条主线索。在理论上,科学数据服务三层次论影响颇深,三个逐步深入的层次包括:数据参考咨询服务、数据收集服务和数据计算服务。数据参考服务类似于图书馆传统的参考咨询服务,主要包括数据发现、辅助检索和教育;数据收集服务通常由学科馆员来主导,主要包括选择和获取数据集,建立本地数据集;数据计算服务是帮助研究者将已经获取的数据利用到实际科研工作,这要求图书馆员了解数据统计分析技术、熟悉相关工具的使用[4]。后来,Bennett[5]将这一数据服务内涵进一步拓展为更多层次,吸收了新的数据管理、管护和保存服务类型,以期实现更广范围的、更具前瞻性的数据服务。此外,2001年,ARL出版了数值型数据产品和服务规范工具包(SPEC Kit)[6],以期为数据服务提供规范的理论框架。在实践研究中,Hogenboom等研究表明:可用性科学数据量的多少与用户对数据服务渴求的强弱正向相关[7-8]。科学数据管理需求调查发现,科研工作者对科学数据管理服务的热情并不高,他们对安全的存储数据、运用数据集和快速出版成果的关注度比共享数据和长期保存数据更高[9-10]。实践调研的启示基本上达成共识:图书馆数据管理与管护服务不够成熟并处于不断发展中,虽然发展中困难重重,但图书馆面向数字科研的服务已成为大趋势。图书馆自身力量无法完成这项任务,迫切需要组织层面的、甚至国家/国际层面在基础设施建设和服务提供上的合作,图书馆员在科研工作的早期便与科研用户建立广泛联系并提供数据服务,有可能使科学数据服务更奏效[11-12]。此外,相比其他数据服务,数据计算服务很少被讨论,通过实证调研发现其原因有二:一是相对于数据发现和获取需求而言,科研用户对数据分析服务的需求似乎不是很迫切;二是校园内的信息技术部门、统计分析服务部门可以替代图书馆的数据计算服务[13]。然而,Bennett等[14]调查显示:招聘启事和国际社会科学信息服务与技术协会(IASSIST)网站中,数据计算经验、尤其是与知识利用相关的数据计算技能特别受欢迎;同时,一些学术图书馆的网站上也出现了统计分析软件服务。这些信息表明:图书馆员如果充分理解科研用户的科研活动情境,并全过程嵌入到科研活动当中,从而确实通过数据计算为用户科研提供强大支撑,数据计算服务有可能成为图书馆数据服务后续重要方向。

  上述研究表明,用户在科研活动中对数据十分依赖,他们对数据服务的需求也会随着对数据依赖程度的提高而变得越来越丰富,深入渗透到学术科研服务中已成为图书情报事业未来发展的主流,传统的数据服务通过数据获取和发现帮助用户从大量和持续变化的信息中获得了适合的数据资源,从而满足了当时情境下的用户需求。而在大数据时代,科学数据的与日俱增,新形式出版应用的开发,对现有数据管理与服务能力提出了巨大挑战,图书情报机构必须重新认识数据服务、进一步深入理解用户甚至引领用户,在大数据和云计算支撑下,打破机构壁垒实现多方合作,进行全方位数据收集、深度资源聚合和建立数据交换中心,推动现有数据服务的变革。

作者简介

姓名:杨国立 周鑫 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg

回到频道首页
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们