如何写论文?写好论文?免费论文网提供各类免费论文写作素材!
当前位置:免费论文网 > 教育论文 > 学术期刊与科学数据仓储的关联

学术期刊与科学数据仓储的关联

来源:免费论文网 | 时间:2018-04-08 14:28:16 | 移动端:学术期刊与科学数据仓储的关联

学术期刊与科学数据仓储的关联 本文关键词:仓储,关联,学术期刊,科学,数据

学术期刊与科学数据仓储的关联 本文简介:在传统的学术交流体系中,学术期刊也以科学文献为主要报道内容。随着数据密集型科研范式的兴起,越来越多的学术期刊出台期刊数据政策,要求作者在提交学术论文的同时,必须在学术期刊或在第三方科学数据仓储提交相关的科学数据。学术期刊通过和科学数据的关联,为用户提供集文献和数据于一体的信息服务。目前看来,学术期刊

学术期刊与科学数据仓储的关联 本文内容:

在传统的学术交流体系中,学术期刊也以科学文献为主要报道内容。随着数据密集型科研范式的兴起,越来越多的学术期刊出台期刊数据政策,要求作者在提交学术论文的同时,必须在学术期刊或在第三方科学数据仓储提交相关的科学数据。学术期刊通过和科学数据的关联,为用户提供集文献和数据于一体的信息服务。目前看来,学术期刊与科学数据之间的关联实践成为研究科学文献和科学数据关联的典型范例和最活跃研究对象,本文以学术期刊与科学数据仓储的关联为研究对象,希望通过本文的努力,为我国图书馆开展科学文献与科学数据仓储关联提供参考。

1学术期刊的期刊数据政策

期刊数据政策是数据密集型科研范式下,学术期刊制定的提交数据、保存数据、开放数据、共享数据的重要措施,它对数据的提交方式,数据的内容、共享范围、有效期、版权、保存方式等具体信息进行了规定[5]。对期刊数据政策的分析可以加强我们对学术期刊与科学数据仓储关联的认识。如期刊PLoSOne要求所有论文中涉及到的数据都必须无限制的开放,要求作者在提交论文时,同时提供一份“数据可用性说明”,以描述论文涉及到科学数据的使用和访问方法。PLoSOne推荐几种数据存储的途径,其中强烈推荐将数据存储在公开的数据仓储中[6]。BioMedCentral鼓励所有作者将数据以一种可机读的方式存储在公共数据库中,并且在“数据可用性说明”中提交数据DOI或AccessionNumbers[7]。从期刊数据政策可以看出,学术期刊往往要求作者将与论文相关的科学数据,提交至学术期刊或公共科学数据仓储。如Wiley、Springer等出版商要求作者将科学数据存储在PANGAEA等数据存储库;Science[8]、PNAS[9]、Nature[10]、BMC[7]等国外学术出版社和期刊出台相关的数据政策,要求作者提交论文的同时,也要提交相应的科学数据;PubMed中的文章可以与GenBank、Dryad等数据存储库中的数据进行关联等[11]。JISC资助的旨在调研学术期刊数据政策的项目JournalResearchDataPolicyBank针对400种期刊的科学数据政策调查发现,其中约一半的期刊对其所发表文献的支撑数据提出定向存储的要求,要求作者在提交学术论文时,必须同时或在第三方科学数据存储库提交相关的科学数据[12]。特别是地理科学、基因学、生物学等学科数据量较大的学术期刊,往往会为作者提供用以存储与期刊文献关联的科学数据的数据仓储。如美国地理协会(TheGeologicalSocietyofAmerica,GSA)的GSADataRepository专门用以存储其出版的科学期刊的支撑数据[13]。Dryad于2011年提出联合数据保存政策(TheJointDataArchivingPolicy,JDAP)提出支撑学术论文的科学数据也应该被保存在合适的公共存储中,以被读者获取和访问[14]。JDAP最先被生态和进化学领域的期刊提出,目前已成为大多数学术期刊制定数据政策的主要参考标准。采用该政策的期刊多推荐使用Dryad作为定向存储数据的数据仓储。

2学术期刊与科学数据仓储关联现状

数据密集型科研范式下,越来越多的学术期刊开始尝试与科学数据进行关联,实现论文和数据的互操作,为用户提供集文献和数据于一体的信息服务,实现科学数据的增值再利用。本文通过对国外有代表性的期刊数据政策、学术期刊与科学数据关联实践、以及部分代表性的科学数据仓储的调研和分析,来了解学术期刊和科学数据仓储之间的关联关系。国内学术期刊与科学数据关联实践才刚起步。《现代图书情报技术》从2016年第2期起,要求所有发表论文提交支撑论文结论的数据,编辑部将对论文和数据进行关联和出版;《图书馆杂志》也开通了数据管理平台,鼓励作者在提交数据论文的同时,提交数据全文或数据引用方法[17]。傅天珍、陈妙贞于2014年对我国学术期刊数据出版政策的调查发现,即使在我国最具国际影响力的期刊中,拥有数据政策的期刊数量仍非常有限,且主要是自然科学与工程技术类期刊。国内关于学术期刊与科学数据仓储关联的研究尚且不多,主要集中在两个方面:一是对学术期刊科学数据政策的研究。吴蓉等调研了Science、Pans、Nature、BMC的期刊数据政策,从数据提交规范、数据审查政策、数据权益政策等方面进行了论述;陈秀娟等对美国化学学会期刊的数据政策进行了剖析;雷秋雨等对进化生物学领域期刊的数据政策进行了综述;陈全平从主体、客体与主要内容的角度分析了期刊数据政策;二是对科学文献和科学数据的关联性研究。黄筱瑾基于元数据描述的角度,分析了科学数据和科学文献关联的几种模式;邱春艳[23-24]在2014年和2015年的两篇论文中对期刊文献与科学数据的关联服务及其实现进行了比较全面的研究;郭学武总结分析了科技数据与科技文献相互关联的三种主要模式:基于引用的直接关联、基于同被引关联和基于引文网络的扩展并联。

3学术期刊与科学数据仓储关联实现方式

与科学数据仓储建立合作关系

学术期刊与科学数据仓储建立合作关系,可以根据二者的实际情况,最大可能的合作实现学术期刊与科学数据的关联,增强文献和数据关联的广度和深度,促进科学数据的开放共享。如Elsevier希望通过与科学数据的关联,完善论文的上下文环境,为用户提供更完善的科研产出,构建完整的论文产出成果,尽可能地提高数据集的可获取性来支持科研人员的研究。已与包括ProteinDataBank、Encyclo-pediaofLife、CambridgeCrystallographicDataCenter、PANGAEA、SIMBADAstronomicalDatabase、Dryad在内的50多个科学数据仓储建立了合作关系,通过Elsevier开发的ScienceDirect平台与这些科学数据仓储进行关联和互操作[26]。目前学术期刊已与一些大型公共科学数据仓储之间建立合作关系。Dryad鼓励学术期刊成为Dryad的合作伙伴,构建学术期刊与Dryad的集成系统,使用户在提交学术论文时,可以同时在学术期刊系统提交相应的科学数据至Dryad,实现学术期刊和科学数据仓储的无缝关联,目前已与130余种期刊之间实现了合作关系,如PLoS的全部期刊已与Dryad实现集成,作者在提交论文的同时,相关数据可同步至Dryad。Dataverse科学数据仓储系统则提供了与学术期刊系统的集成插件,学术期刊利用Dataverse的数据仓储插件,建设与自身系统集成的Dataverse数据仓储,集成期刊论文与科学数据的提交、管理、编辑、评审等过程[28]。FigShare作为一种新的分享开放科学数据的方式,研究人员可以在FigShare上,以可引述、搜寻、共享的方式发表他们的数据。FigShare也是学术期刊的主要合作对象,如与300多种BioMedCen-tra、SpringerOpen、Wily期刊合作,将FigShare集成到学术期刊的工作流和论文出版过程中。

学术期刊与科学数据仓储的无缝集成

(1)学术期刊与科学数据仓储无缝集成概况。数据密集型科研范式下,学术期刊积极谋划与科学数据仓储更紧密的合作和关联,通过将学术期刊系统与科学数据仓储的集成,在学术期刊系统嵌入科学数据仓储插件,使学术期刊系统具备科学数据管理功能,实现在提交科技论文的同时,能够同时对相关的科学数据实现提交、描述、管理、存储等功能,科学数据仓储同时接受从学术期刊系统传递过来的科学数据与元数据。实现科学文献和科学数据在提交、管理、发布等流程中的无缝集成,最终在学术期刊的访问页面,为使用者提供访问科学文献的同时,提供科学数据的阅读、引用、分析等体验。学术期刊与科学数据仓储的无缝集成,对于作者、期刊编辑、评审人员以及文献和数据的关联的主要作用表现在:①简化作者的数据提交流程;②可以使作者更多的将科学数据提交到统一的科学数据仓储;③期刊编辑和评审人员可以同时看到论文和数据,使评审工作更科学;④将对科学数据的元数据描述和对期刊论文的元数据描述统一起来,增强二者关联性;⑤实现期刊论文和科学数据之间的双向链接;⑥保证期刊论文可公开访问时,科学数据也可以访问[32]。(2)学术期刊与科学数据仓储无缝集成的工作流。在学术期刊出版中集成科学数据的提交和发布,体现在学术期刊与科学数据提交、编辑、描述、存储、评审、发布等工作流的重构与集成。传统学术期刊的工作流以文献为中心,将科学数据加入进来,需要对以往的工作流进行重构,把对科学文献和科学数据操作的工作流集成,形成统一的工作流,在统一的界面、步骤中完成科学文献与科学数据的提交、出版等操作。这种工作流的集成使用户在提交、编辑、描述论文的上下文环境中同时提交、编辑、描述科学数据,实现了文献和数据的集成操作,避免了二者割裂的提交,使用户能更及时、准确的对支撑论文的科学数据进行组织和描述,增强了文献和数据的关联,提升用户的体验。PKP-Dataverse通过对学术期刊工作流的重构与集成,使作者、编辑、评审人员可以同时完成对科学论文和科学数据的操作,提高工作效率,加强文献与数据的关联强度(工作流见图1)

基于作者提交数据DOI构建关联

当用户将科学数据存储到数据仓储时,科学数据仓储会生成数据DOI,用户在提交期刊论文时,将数据DOI同时提交给学术期刊,方便实现论文与科学数据仓储的关联。从目前的调研来看,学术期刊要求作者提供数据DOI,基于作者提交数据DOI来构建期刊论文和科学数据之间的关联,成为构建期刊论文和科学数据之间关联的主要方式。

学术期刊识别与构建与科学数据的关联

通过作者提交数据DOI来实现与科学数据的关联,是最简单、易于实现的方式。然而作者提交的数据DOI并不能代表与该文献内容相关的所有科学数据,除了作者提交的数据DOI,该文献还可能与其他科学数据存在主题相似或其他关联关系。学术期刊也在积极通过各种方式,来实现与这些科学数据的关联。(1)通过识别文本中的语义实体来进行关联。一般而言,作者在文中涉及到的一些重要概念、术语、词组等,也具有一定的科学意义,通过识别这些语义实体,在后台的数据发现系统中,发现并构建与这些语义实体关联的科学数据,可以更全面的实现文献和数据关联。如Elsevier通过人工识别和自动文本挖掘的方式,对作者行文中的语义实体进行识别,通过ScienceDirect构建这些语义实体与相关数据的关联,为用户提供更全面的阅读体验[26]。(2)与科学数据仓储合作开发数据APP。学术期刊与可信任的科学数据仓储合作开发数据APP,通过数据APP,可以更大程度的发现与识别文献中涉及的与该科学数据仓储有关的科学数据,并通过集成展示的方式,在文章页面展示相关的科学数据。El-sevier与可信赖的数据仓储之间建立了紧密的合作,已经开发了许多数据APP,例如ProteinViewer(PDB)、PANGAEARelatedData、GenomeViewer(NCBI)等。这些数据APP保证了文献与这些科学数据的发现、识别与关联。(3)构建科学数据登记注册中心。虽然,学术期刊识别了论文中的科学数据语义实体,但是不知道与哪些科学数据仓储进行关联,以及有哪些与该文献相关的科学数据。通过构建科学数据登记注册中心的方式,科学数据仓储在科学数据注册中心进行注册,学术期刊在科学数据注册中心进行搜索与发现与之关联的科学数据仓储。目前国际上比较著名的科学数据登记注册中心包括Re3data.ORG与DataCite。Re3data.ORG是一个科学数据仓储注册中心,主要目标是提供科学数据的全景地图,鼓励科学数据开放共享。科学数据仓储在Re3data.ORG注册时,需要的主要注册信息包括:数据仓储的简短描述、内容类型、关键词、科学数据的受资助机构、数据集的许可证、数据集版本、数据DOI等。截至2017年9月,已经有1900余个科学数据仓储在Re3data.ORG注册。DataCite是一个为科学数据提供数据DOI的非盈利组织,科学数据仓储产生的数据DOI,通过在DataCite进行注册,为科研组织定位、识别和引用科学数据提供帮助[37]。如,Dryad提供的数据DOI就会在DataCite进行注册,以方便第三方的查找和识别。


学术期刊与科学数据仓储的关联》由:免费论文网互联网用户整理提供;
链接地址:http://www.csmayi.cn/show/213603.html
转载请保留,谢谢!