数据共享
数据共享是使同一数据资源可供多个应用程序、用户或组织使用的过程。这一过程包括技术、实践、法律框架和文化要素,可以促进多个实体的安全数据访问,而不损害数据完整性。简单来说,数据共享就是在不同地方使用不同电脑、不同软件的用户可以读取其他人的数据,进行各种操作和分析。早在20世纪50年代,就提出了数据共享的思想。1957年,国际科学技术联合会建立了世界数据中心(WDL),使数据收集、存储、交换和使用国际化。20世纪90年代,美国提出了数据共享的概念,建立了9个国家数据中心。21世纪,科学数据开放共享的国际氛围日益成熟,一些国家以政府数据开放共享为核心,普遍开展数据开放共享实践。
数据共享可以通过各种技术实现,包括云存储、文件传输协议(FTP)、应用编程接口(API)、Web服务和专用协作平台。许多国家组织、大学和公司都建立或参与了共享平台,实现数据共享,可以让更多的人充分利用现有的数据资源,减少数据采集、数据收集等重复性工作和相应的成本,专注于开发新的应用和系统集成。
发展历史 编辑本段
大数据时代,数据的开发和再利用很大程度上依赖于数据共享。早在20世纪50年代,就提出了数据共享的思想。1957年,国际科学技术联合会建立了世界数据中心(WDL),使数据收集、存储、交换和使用国际化。美国从20世纪70年代开始建立数据自由的法律法规,90年代提出开放数据共享的概念,建立了9个国家数据中心。与此同时,国内很多科学家开始呼吁数据共享。2000年,中国气象局在国内率先实现部门内数据共享,2001年,中国建成8个数据中心。自20世纪10年代以来,关于数据共享的研究一直备受关注。有研究者提出,通过数据共享,分析以前产生的数据,可以发现新的知识,数据共享是必然的。数据共享的概念开始吸引研究利益相关者的支持,如研究资助者、期刊出版商和科学家,他们形成了一股合力,将世界变成一个数据共享实体。一些国家以政府数据开放共享为核心,普遍开展了优秀有效的数据开放共享实践,在企业数据开放共享方面也有“开放银行”等创新探索实践。
实现方法 编辑本段
数据共享可以通过各种技术实现,包括云存储、文件传输协议(FTP)、应用编程接口(API)、Web服务和专用协作平台。
云存储:云存储系统中的所有设备对用户完全透明,任何地方的任何授权用户都可以通过接入线缆与云存储连接,访问云存储的数据。通过数据存储空间,用户可以将数据保存到设备中,计算机可以根据需要从各种来源读取输入数据,然后创建输出,并保存到同一来源位置或其他存储位置,以便用户与他人共享数据。
网络服务:Web服务技术是一种基于XML技术和现有及新兴标准(或协议)的程序间通信模型。它使用统一的方法来描述、注册和查询服务。其主要目标是通过使用统一的标准来统一数据、消息和行为,使不同的系统可以跨平台、相互兼容、无缝共享数据,而无需考虑具体的应用环境。
文件传送协议:文件传输协议(FTP)是数据共享中最古老、应用最广泛的协议之一,它使网站、计算机和其他设备能够以有组织的方式交换数据,确保数据在传输过程中的完整性和安全性。它为客户端和服务器端之间的数据传输提供了通道,并通过互联网实现数据共享。
专用协作平台:国家机关、企业和高校将通过建立或参与专门的协作平台来实现数据共享,如微软的Azure、中科院发布的“数据共享服务系统”、北京大学开发的“数据共享开发服务平台”等。数据发布者通过数据共享平台上传数据资源,并选择是否公开共享,该平台支持所有允许的用户浏览、查看、订阅和下载。作为媒介,平台可以存储用户上传的代码、数据、文本、图形、图像、应用程序或软件。
应用程序界面:应用编程接口(API)是一组允许机器对机器通信的软件指令和标准。这是一种安全的数据共享方法,允许应用程序之间自动共享数据。API通过自动更新信息节省了时间,也使信息更加可靠,因为所有信息都由单一来源管理,这就产生了开放性,使开放数据能够以一致的方式通过多个来源共享。通过API可以随时获取数据,获取的数据格式也比较灵活。
区块链技术:区块链技术是一种分布式账本技术,由多方共同维护和去中心化。区块链具有可追溯、不可篡改的特点,可以有效解决传统数据共享带来的单点故障,保护数据安全。区块链的工作流程是:每一笔交易发生时,都会被记录为一个数据“块”,每个块与它前后的块相连,交易以块的形式组合成一个不可逆的链条。
相互性原则:数据共享的原则是数据、元数据、产品和信息应完全公开共享,但应遵守国家或国际法律和政策,包括尊重适当的现有限制,并符合国际伦理研究行为标准。为研究、教育和公共使用而产生的数据和信息应在最短时间内免费提供,或不超过通信费,低收入用户群体可免除通信费,以支持公平。
每个生成、共享和使用数据和元数据的人都是这些数据的管理者,并确保数据的真实性、质量和完整性得到保护。默认情况下,数据应该是开放的,并标记为“敏感”或“受限”,要处理的数据应按照数据管理员和生产者要求的安全性进行处理,并保持数据的完整性和机密性。
数据共享类型:数据共享的方法非常不同,涉及各种类型的参与者,并且具有不同的目标。数据共享模式因数据提供者而异,包括个人、私营公司、政府机构、非营利组织和研究机构。例如,两个企业可以使用合同协议共享数据以促进大型项目的合作,或者多个个人可以通过独立的组织共享数据以获得财务利益。在ITIF发布的报告中,分为六种不同的模式,分别是数据共享伙伴关系、数据联盟、数据信任、数据合作、联邦数据分析和合作研发协议。
数据共享伙伴关系:数据共享伙伴关系涉及不同实体(如学术机构、研究机构、行业伙伴、个人消费者和政府机构)之间的协作,以共享和交换数据,从而开展研究、联合开发新产品和加强循证决策。这些伙伴关系旨在利用多方的集体专业知识、资源和数据创新中心来解决复杂的问题并产生有价值的见解。此外,这种类型的数据共享安排通常需要明确的协议来界定数据访问和使用权以及知识产权的所有权,具体特征根据所涉及的数据类型和合作性质而有所不同。
数据联盟:数据联盟允许组织集中他们的数据以获得团体的利益。数据联盟有一系列互惠共享协议,只有特定联盟的成员才能访问数据,联盟成员通常需要做出贡献。数据联盟可以解决具体问题或一般性、持续性的信息交换,促进更多的数据共享和聚合。例如,临床研究数据共享联盟的成员包括生物制药公司、学术机构、非营利组织和患者权益倡导者。这些团体聚集在世界各地,提供对临床数据的集体访问,并帮助研究人群多样化。
数据信任:数据信托是一个供多个实体贡献和访问的组织,它是一个数据治理框架,管理、保护和共享数据,以代表个人和组织的商定目的。数据信托的核心是将数据权利委托给一个独立的中介机构,即受托人,受托人与研究人员、私人公司和公共部门机构做出有利于数据主体的数据共享决策。数据信任为管理和使用汇总数据提供了结构和规则,并有助于向公众释放其价值。
数据合作:数据合作模式多用于公共服务领域,通常由基金会、私人公司或个人用户管理和运营。数据提供者或数据拥有者自愿分享的数据,由数据合作社进行结构化和匿名化,然后由数据需求者运行算法产生价值。这种模式多对公共数据或科研开放,既能使数据需求者获得足够的数据样本来训练算法,又不会泄露数据提供者或数据所有者的个人隐私。
联邦数据分析:联合数据分析是一种允许在组织不能或不愿意共享数据时进行数据分析的方法。联邦数据分析采用分布式数据处理方法。在这种方法中,数据在不同的位置进行分析,只有汇总的意见才会集中到一个位置。例如,由生物制药公司勃林格殷格翰和医疗软件公司Lifebit Biotechnology构建的可扩展联合分析平台可以从生物样本数据库数据中获得基因组洞察。联合分析高度保护了敏感生物医学数据的隐私,并允许研究人员从单一数据存储中获得洞察力,并产生医学创新。
合作研究与发展协议:合作R&D协议是政府和私营部门之间的伙伴关系,政府研究机构与私营部门伙伴共享数据,以促进R&D项目的商业化。根据这些协议,政府提供人员、服务、设施、知识产权、设备、数据等。敬合伙人。它允许私营部门的合作伙伴申请并保留专利,同时确保政府获得商业产品的许可。例如,美国国家海洋和大气管理局利用合作研发协议,招募IBM、微软和AWS等私营公司开发解决方案,以提高数据利用率和访问能力。
实现意义 编辑本段
数据共享程度反映了一个地区和国家的信息化发展水平。数据共享程度越高,信息化发展水平越高。实现数据共享可以使研究人员、研究资助者、数据仓库、科学界和公众受益,使更多的人能够充分利用现有的数据资源,减少数据收集和数据采集的重复性工作和相应的费用,并专注于开发新的应用和系统集成,而不是重复现有的研究。
数据共享可以提高公众的生活质量。一些城市在解决交通拥堵、看病难、应急处理等问题时,共享应用了以大数据、物联网、云计算为支撑的智能技术。这些数据的共享使得信息的传递扁平化,提高了决策的科学性和准确性,提高了城市运行和基层治理的效率。
在公司治理方面,数据共享可以使企业发现重要的数据资产,从而增强员工的协作和生产力,企业可以通过团队合作发现新的前景并获得竞争优势。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。