数字对象标识符
数字对象标识符(DOI)是一组由数字、字母或其他符号组成的字符串,它是一个永久的标识符或句柄。任何实体(数字的、物理的或抽象的)都可以通过称为DOI号的全球唯一和永久的标识符来识别。
DOI起源于出版业三个行业协会(国际出版商协会、国际科学、技术和医学出版商协会和美国出版商协会)的联合倡议。该系统于1997年在法兰克福书展上发布。同年,DOI基金会成立,以开发和管理DOI系统。自1998年以来,基金会一直与INDECS项目(1998-2000年)以及基于该项目的一系列后续和持续举措密切合作。
DOI系统提供了一个技术和社会基础设施,组织可以在此基础上构建应用程序来为用户或用户社区提供服务。2010年,DOI通过了ISO国际标准认证。截至2015年底,全球共有1亿个DOI代码、9个RA(DOI注册机构)和数万个注册单位,这些代码已被分发和分析,其应用已横跨美国、欧洲、澳大利亚和一些非英语国家,其应用也从数字文件出版商扩展到政府部门。Elsevier、Blackwell、John Wiley和Springer等大多数大型出版商都使用DOI来识别数字资源,形成了命名、申请、注册和更改等相对完整的管理机制,DOI的分析系统发展相对成熟。
DOI具有唯一性、永久性、开放性、动态维护、多元分析、动态跟踪、版权保护等特点。DOI是实现开放知识链接的基础,促进了资源的整合与共享,有效保护了数字资源的知识产权。
外延定义
DOI是一组由数字、字母或其他符号组成的字符串,用于标识数字内容资源。它可以分发到任何使用网络的数字实体,并广泛用于识别学术、专业和政府信息,如期刊论文、研究报告和数据集以及官方出版物。它还可以用于识别其他类型的信息资源,如商业视频。您可以通过将DOI绑定到元数据(如URL)来查找对象的位置。它不仅有命名资源的机制,还有将标识号解析为特定地址的协议、基于句柄系统的实体标识系统和解析标识符的全局分布式系统。DOI数字可以解析为资源,例如Web或Internet资源、描述实体的元数据、可以访问更多资源的登录页面等。
发展历史
DOI的诞生可以追溯到美国出版商协会(AAP)于1994年成立的“使能技术委员会”,其任务是设计一个在数字环境中保护知识产权和版权所有者商业利益的系统。DOI系统是由国际出版商协会、国际科学、技术和医学出版商协会以及美国出版商协会发起并建立的。起初,DOI系统只为出版资源服务。作为数字环境中版权管理和保护的工具,公众认为DOI系统是一个能够管理和识别数字网络内容、识别和整合数字资源和多媒体应用的通用框架。
DOI于1997年在法兰克福书展上发布,DOI系统由IDF(世界银行机构发展基金)管理和完善。IDF认为Handle System拥有迄今为止管理数字对象最完善的架构,因此DOI选择Handle System进行研发。但是,对于用于管理知识内容和促进电子商务建设的DOI系统,需要在Handles的基础上添加新功能来完善其框架。
DOI系统建立后,IDF选择CNRI作为其技术合作伙伴,并从1998年开始参与INDECS项目以支持DOI数据模型。在CNRI的合作下,IDF制定了DOI标准和相应的分析系统处理系统。2000年,DOI语法通过了NISO标准化,2010年,DOI系统被ISO批准为国际标准。本标准规定了数字对象标识符系统的语法、描述和解析功能组件,以及创建、注册和管理DOI名称的一般规则。2012年5月,DOI标准正式出版印刷。
大多数外文出版社和全文数据库都采用了DOI作为文章的唯一标识符,它在许多领域得到了应用,包括:Elsevier、Blackwell、John Wiley和Springer等大型出版社大多使用DOI来识别数字资源,中国出版社如高等教育出版社和中国科学出版社也使用DOI。
它还包括小型非营利行业协会或学会,如美国计算机协会(ACM)、英国剑桥大学出版社(CUP)、牛津大学出版社(OUP)、中国浙江大学出版社、中国理论与应用力学学会等。它还包括新的开放式出版社,如生物医学中心;;CABI Publishing等一些二手文学出版社也是该联盟的成员。此外,还有国家或国际组织,如世卫组织出版社和世界银行,以及信息服务机构,如日本科学技术机构(JST)和德国科学技术信息研究所(TIB)。
根据CrossRef的统计数据,截至2015年4月27日,加入CrossRef的出版商和学会有4733家,图书馆有1950家,涵盖38895种期刊,其中非营利出版商占57%。DOI国际标准在科技期刊数字化和国际化中的应用已日趋成熟。截至2020年12月31日,已有超过15,000个成员或组织加入了CrossRef,并且有超过1.28亿个存储了元数据的学术内容项目。
结构规则
DOI(美国标准ANSI/NISO Z39.84-2000)的编码方案规定DOI的结构式为:。/,而DOI分为前缀和后缀,由斜杠分隔。前缀和后缀的字符长度没有限制,因此DOI编码系统的容量是无限的。DOI的命名结构使每个数字资源在世界上都是独一无二的。DOI不同于URL,它是数字资源的名称,与地址无关。事实上,它是一种URI(统一资源标识符)或统一资源名称(统一资源名称),是信息的数字标签和身份证。DOI使信息具有唯一性和可追溯性。
DOI前缀由两部分组成,一部分是目录代码,另一部分是注册机构代码。前缀由一个点分成两部分,这是DOI的特定代码,其值为10,用于区分DOI和其他应用Handle系统技术的系统。(注册人代码)是DOI注册机构的代码,由DOI的管理机构IDF(国际DOI基金会)分配,由四个或四个以上的阿拉伯数字组成。
DOI后缀是特定前缀下的唯一后缀。DOI后缀字符串由DOI注册机构分配,这确保了其唯一性。后缀可以是任何字母数字代码,其编码方案完全由注册机构自己指定。后缀可以是机器代码或现有规格代码。主要是学术出版商自己给的,规则不限,只要在该出版商的所有产品中独一无二即可。因此,每个出版单位的期刊文献后缀编码组成是不同的,如ISBN、ISSN、ISTC和PII。
根据IDF(国际DOI基金会)发布的DOI手册,DOI代码不区分大小写,必须被任何DOI系统识别。例如,DOI代码“10.1234/abc”和“10.1234/ABC”实际上是相同的DOI代码。
根据DOI编码的语法规则,后缀可以是包含任何字母和数字的字符串。在实践中,建议仅使用数字、字母(0~9、a-2、A~Z)和一些标点符号,包括连字符(“_”或2DHex)、句点(“。”或2EHex)和下划线(“_”或5FHx),而不是任何其他ASCII字符或U007F以上的字符。
技术特征
DOI基于两种技术:句柄系统和元数据框架。Handle System是国家研究计划公司(CNRI)开发的一个技术平台,用于命名、解析和管理互联网信息。(e-corner-merce系统中数据的互操作性)是一套用于电子商务环境中数据互操作性的元数据框架。选择它作为元数据框架为DOI的各种应用提供了基础。处理系统和元数据框架为DOI提供了从单一解析到多重解析的应用。首先,单地址解析机制为用户提供了对数字资源的永久访问。为了避免资源地址变化导致用户链接失效,DOI系统对资源地址进行有效管理。当发布者为每个资源注册DOI时,为了同时向处理系统主机提交DOI名称和资源的URL,发布者负责维护DOI数据。当资源地址发生变化时,例如在线期刊文章从当前发行目录转移到存档目录时,发布者应通知处理系统主机进行相应的更改以确保链接的有效性。当用户点击资源的DOI请求信息时,用户的请求被传送到Handle系统服务器,Handle系统服务器将DOI解析为URL并将其返回给用户终端,以便用户可以访问该资源。对于用户来说,无论资源地址发生任何变化,他们总是面临相同的DOI。DOI提供的资源链接是永久性的。
分析机制
单一分析
单一地址解析机制提供了对数字资源的永久访问。DOI可以唯一地识别单个数字资源,并可以保证在网络上永久链接到该数字资源。因此,DOI系统的核心功能是将DOI解析到注册的URL地址,通过DOI代理服务器可以轻松可靠地链接全文。
为了避免用户链接由于资源地址的改变而失效,DOI系统有效地管理资源的地址。当发布者为其每个资源注册DOI时,它必须同时向句柄系统主机提交资源的DOI名称和URL,它们存储在DOI目录中。发布者负责DOI数据的维护。
当资源地址发生变化时,例如在线期刊文章从当前发行目录转移到存档目录时,出版商应通知处理系统主机进行相应的更改以确保链接的有效性。当用户点击资源的DOI来请求信息时,用户的请求被传输到Handle系统服务器,该服务器将查询DOI目录,然后将DOI解析为URL并返回给用户终端,以便用户可以访问该资源。所有这些都是在后台完成的。对于用户来说,无论资源地址发生任何变化,他们都始终面对同一个DOI,并且DOI提供的资源链接具有永久有效性。
多重分析
DOI提供多元分析增值服务,更好地促进科技期刊论文的传播。多重解析指的是一个DOI代码,可以对应多个解析地址。也就是说,一个已识别的数字对象将具有许多相关资源,并且可能有多个副本放置在不同的地方。Handle System的多重解析机制使DOI不仅可以指向一个URL,还可以指向多个相关的URL和其他类型的元数据。
优势特点
独特性:DOI标识符作为数字对象的标识符,相当于人的身份证,对被识别的数字对象是唯一的。这一功能确保在网络环境中准确提取数字化对象,并有效避免重复。
持久性:数字化对象的DOI标识符一旦生成,就永远不会改变,它不会随着它所识别的数字化对象的版权所有者或存储地址的改变而改变。
兼容性:DOI标识符的兼容性在于DOI号的后缀可以包含任何现有的标识符,如ISBN、ISSN、ISTC、PII等。
互用性:DOI系统提供了与数字对象相关的元数据,可以使不同的应用系统理解DOI标识符所表示的数字对象,从而为应用系统的互联提供了技术基础。
动态更新:在DOI系统中,与DOI相关的元数据可以动态更新,以确保DOI标识符提供的信息的有效性。如果更新数字对象的链接地址,则可以有效避免“死链”。
国际通用:2010年11月,DOI系统(ISO 26324信息和文献-数字对象标识符系统)正式成为ISO标准,并于2012年5月10日正式发布。各国相关产业链的参与者可以遵循统一的DOI标准来识别和分析数字对象的链接,这可以大大降低行业的技术沟通成本和社会沟通成本,促进跨国家、跨语言、跨系统和跨机构的资源链接和共享。
应用场景
学术研究领域:DOI常用于学术研究领域,它赋予学术论文、期刊文章、书籍和报告等数字资源在全球范围内的唯一标识符。通过DOI,研究人员可以轻松引用和链接到相关文献的全文或特定部分,从而提高研究效率。
学术出版领域:DOI也广泛应用于学术出版领域。出版商可以使用DOI标识符链接到已发表论文或书籍的电子版,方便读者获取全文。此外,DOI还可用于出版物的元数据管理,便于出版商、图书馆员和研究人员检索和管理信息。
学术评价体系:DOI在学术评价体系中也发挥着重要作用。学术期刊和出版商通常要求作者在提交论文时提供DOI编号,以便将论文与已发表的文献进行比较和引用。这有助于评价论文质量和影响力,为学术期刊和作者学术声誉评价提供参考。
图书馆和信息管理领域:图书馆和信息管理机构可以使用DOI来识别、管理和检索数字资源。通过DOI,图书馆可以将其电子资源与世界各地的学术资源联系起来,方便读者获取所需信息。同时,DOI还可以帮助信息管理组织对海量数据进行分类、组织和存储,提高信息管理的效率和质量。
其他领域的应用:DOI识别的数字对象类型越来越广泛,除上述期刊、书籍和科学数据外,还包括会议记录、学位论文、标准、科学报告和其他文献资源。2010年,土井跨过出版行业,正式进入影视作品领域。2010年6月,在好莱坞建立的娱乐ID注册(EIDR)服务申请加入IDF并被批准为RA。截至2011年11月底,其DOI注册量已超过24万。其他类型的数字对象将逐渐纳入DOI识别的范围。西方DOI的发展充分证明了西方数字出版商通过合作寻求生存的想法。通过这一理念的实施,它不仅为图书馆和用户带来了最佳服务,还扩大了整个行业的生存空间。