- 信息时间:2021-06-09 17:16
- 浏览次数: 114
【摘 要】爱尔兰数字存储库是保存爱尔兰历史文化遗产和科学研究成果的国家级数字档案馆,通过开设在线门户网站来保存、管理和持续访问爱尔兰大量人文、社会科学数据。该存储库收藏了来自各组织独特且重要的馆藏,并致力于收集和保存在开放科学、教育、研究和旅游业等多个领域的3D文化遗产数据。除了提供可信任的数字存储库服务之外,爱尔兰数字存储库还是爱尔兰数字归档的研究中心,在存储库基础结构、保存政策、研究数据管理和宣传等方面,为元数据保存、新型档案数据存储以及档案数据库建设等问题的解决提供了先进经验。
关键词:数字档案馆;数据存档管理;3D打印
爱尔兰数字存储库 网站首页
随着信息化时代的迅猛发展,3D打印技术的应用价值逐步显露,如何做好3D数据保存工作也逐渐成为了档案信息化与数字档案馆建设研究的重要内容。作为可靠的文化遗产数字存储库,爱尔兰数字存储库(Digital Repository of Ireland,简称DRI)致力于收集和保存3D文化遗产数据,它鼓励员工尽可能多地接触博物馆文物、考古成果和历史建筑的3D模型,有效推动了3D文化遗产数据保存实践的发展。
作为新型档案形式之一,爱尔兰数字存储库对3D数据存储与应用的研究与探索,将为元数据保存以及数字档案馆建设提供有效借鉴。
01 存储库概况
爱尔兰数字存储库最初是一个由6个学术合作伙伴组成的研究联盟,最早于2012年定期开展项目研究,其创建目的在于长期保护爱尔兰的数字遗产,并且为用户提供访问这些数字遗产的途径。经过长久发展,爱尔兰数字存储库进一步得到了包括爱尔兰国家图书馆(NLI)、爱尔兰国家档案馆(NAI)在内的各学术、文化、社会和行业合作伙伴网络的支持,其工作人员组成背景也更加广泛,包括软件工程设计师、数字档案管理员和图书管理员,以及数字成像专家等。
爱尔兰数字存储库主要用于保存、管理并持续提供丰富的爱尔兰人文和社会科学数据,并向用户提供查看跨机构以及多格式的历史及即时数据信息,数据种类既包括出版书籍,艺术品实物等,还有高质量的照片、音频等文件。除此之外,爱尔兰数字存储库还向用户提供关于数字保存的“专题笔记”,以及标准词汇表和数字化资源指南,以帮助用户了解数字信息保存的各方面信息。
作为一个致力于保护、管理和传播爱尔兰人文、社会科学和文化遗产数据的国家基础设施,爱尔兰数字存储库积极开展爱尔兰人文、社会科学和文化遗产资源长期数字化保存的国家服务项目,是国际公认的数字归档和存储库基础设施的领导者。同时,爱尔兰数字存储库还积极参与政策的制定,也是欧洲开放科学政策的重要贡献者。
近些年来,3D数据作为最新型的数据存储形式受到了普遍关注,但人们对于如何妥善存储与管理3D打印数据信息,如何保障3D打印数据的成套完整而不致丢失等问题的讨论仍然较少。基于此,爱尔兰数字存储库作为欧盟共同资助的3D-ICONS项目的合作伙伴,于2015年开展名为“3D-ICONS:数字化我们的文化遗产结构以供科学和公众使用”的3D数据存储专项研究项目。(https://repository.dri.ie/catalog/nv93jh598)
该项目旨在通过对如建筑文化等标志性的文化遗产使用遥感等3D数字化技术,建立一个完整的3D模型制作流水线,形成历史建筑和其他古迹的复制品,并将内容公开供公众访问,以便用于可视化保护和研究活动。该项目还探讨了适合3D数据遗产的元数据以及知识产权框架等一系列问题。虽然欧盟对3D-ICONS项目的资助在2015年早期就已经停止,但是爱尔兰却一直保持对该项目的投资建设,并且在接下来的时间里,爱尔兰数字存储库将持续探索3D数字资源的开发与存储问题。
02 3D数据存储的技术方法
爱尔兰数字存储库的初始测试数据集是由爱尔兰基础设施部(Transport Infrastructure Ireland)提供的各类考古遗迹、桥梁和著名雕像的地面扫描图。高容量、高分辨率的3D数据扫描图通常以“点云”[1]的形式出现。扫描图由基于ASCII[2]且具有点坐标的文件组成,便于在文件编辑器中打开并提取特征,有利于数据的保存。
爱尔兰数字存储库使用open3D和Cloud Compare技术重建场景的3D副本,然后使用Bender和Meshlab等技术消除噪点。这些轻量级的3D重构网格或副本可能无法保持文件的科学完整性,并且与源文件相比,它们会损失大量的细节。因此,工作人员会将这些副本与源文件一起打包存储。轻量级副本通常会形成用于大多数常规用途的分发信息包(DIP),并能访问原始文件和元数据,这些原始文件和元数据能够标识需要使用的软件和平台。
爱尔兰数字存储库也在探索各种开放格式和标准,例如建筑产品数据IFC标准,面向交互应用的Collada方案,以及用于3D场景传输的glTF格式。这些格式和标准能够确保3D数据更具互操作性,工作人员可以将一些源文件迁移到这些更具互操作性的标准环境中,再将它们与源文件一起保存。
对于爱尔兰数字存储库来说,仿真策略是另一种可行的保存方法。人们可以通过原始源文件的打开和可视化操作来创建仿真环境。但是与其他保存方法一样,这种方法也会存在软件许可等问题,因此实际可操作难度较大。
[1] 点云是在和目标表面特性的海量点集合。在逆向工程中通过测量仪器得到的产品外观表面的点数据集合也称之为点云,通常使用三维坐标测量机所得到的点数量比较少,点与点的间距也比较大,叫稀疏点云;而使用三维激光扫描仪或照相式扫描仪得到的点云,点数量比较大并且比较密集,叫密集点云。
[2] ASCII(American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。
目前,爱尔兰数字存储库正在努力将部分3D数据汇总到Europeana平台[3],作为“共同文化”(Common Culture)项目的一部分[4]。Europeana拥有自己的数据模型用来确保元数据的可互操作性,而Europeana技术框架(Europeana Publishing Framework)则能够改善元数据质量,并且提供更好的展示内容。Europeana建议以可嵌入网络的“查看器”形式提供各种复杂数字对象,例如3D数据。为了整合到Europeana平台,3D查看器应加入oEmbed协议,爱尔兰数字存储库目前也正在对该协议进行研究。
爱尔兰数字存储库使用JavaScript Three库来构建3D查看器,目前已经成功地将3D查看器嵌入到基于Ruby-on-Rails 存储库平台中,为其提供了40多种格式支持,并且同时模型的大小或数量也没有受到限制。这将大大超出其本身的存储能力。
[3] Europeana是一个数字平台,可以让欧洲机构通过在线分享他们的社会和文化遗产数据,接触到更广泛的受众。2019年1月,爱尔兰数字存储库(DRI)开始作为爱尔兰合作伙伴与Europeana合作参与“Common Culture”项目建设,该项目旨在提高由国家数据聚合器提供给Europeana平台的400万份文件的质量。
[4] Europeana Common Culture (ECC)项目促进了欧洲协调和可持续的数据聚合基础设施的发展,提高了数据质量,并通过Europeana网站鼓励人们了解文化遗产。该项目于2019年1月至2020年12月开展,有来自21个欧洲国家的24个合作伙伴。
网址:https://pro.europeana.eu/project/europeana-common-culture。
Europeana 网站首页
03 项目活动
除“Europeana共同文化项目”之外,早在2013年,爱尔兰数字存储库就开始与其他重要机构合作参与开展各种数据存储及利用项目。
比如2014年1月开展的“The Social Repository of Ireland”项目,就旨在研究开发社交媒体针对爱尔兰重大事件回应形成档案的可行性,并意将该档案保存在一个可信的数字存储库,即爱尔兰数字存储库中。除了存档和保存,该研究还将开发半自动化的注释和归档过程,通过档案中的上下文管理丰富数据,并评估社交媒体保存过程中出现的法律和伦理问题。
2020年5月更是在“Europeana共同文化”项目的基础上进一步开展“EUROPEANA SPORT - IRELAND’S STORIES”项目,与爱尔兰移民博物馆、2020年欧洲博览会、亨特博物馆、利默里克大学会议与体育学校等组织合作,向球员、球迷以及过去的运动英雄等收集故事和纪念品,以展示爱尔兰体育历史的丰富和多样性。
不只是长期项目的开展,爱尔兰数字存储库还不定期举行各种数据存储会议,比如即将于2021年4月20日在Zoom线上举行的主题为“Using Digital Archives for Social Sciences Research”的会议,旨在通过举办系列公开讲座,展示数字档案馆藏所包含的丰富研究资源,并讨论如何将数字档案用于学术研究,以解决由于COVID-19的限制引起的实体档案获取受限问题,进而确保依赖档案材料的人文学科研究人员活动的正常进行。
在COVID-19疫情爆发之前,爱尔兰数字存储库各项工作的开展均较为顺利。但受疫情影响,爱尔兰数字存储库开始思考,“作为一个数据存储组织,我们如何才能为人类提供更多价值”。因此,爱尔兰数字存储库发布了《COVID-19:扮演我们的角色》声明(https://www.dri.ie/covid-19-playing-our-part),其中包含各种爱尔兰数字存储库可支持领域的相关信息。
此外,爱尔兰数字存储库决定使用其保存基础结构,来捕获和保存制造商一直在使用的3D打印模型,以用于生产防护面罩。面罩的模型是可开放获取的,人们可以自行从数字存储库中查看和下载。
04 建设成果
爱尔兰数字存储库项目开展至今取得了重要且丰富的成果,尤其体现在著作出版以及学术报告方面。比如2020年4月修改发布的“元数据质量控制”指南,着重讨论了元数据质量控制的基础知识,包括元数据质量的重要性,低质量元数据中的固有问题,以及提高元数据质量的关键步骤等,为元数据的创建以及元数据问题的处理提供了一些程序和可操作工具。
2015年6月发布了“开放存取资料库的资助模式”报告,聚焦于开放数字存储库的运营和维护,提供长期可持续的资金运转等问题。同年5月ALLEA人文科学技术联盟电子人文工作组发布了“走向数字化:人文学科的变革”报告作为研究成果,此报告围绕数据生命周期构建,重点关注数字归档、长期保存、数字研究工具、可持续的电子基础设施和研究网络等问题,讨论了欧洲数字人文研究和支持结构的现状,并提出了促进其持续增长和卓越的创新性建议。
“走向数字化:人文学科的变革”报告海报
05 结语
根据爱尔兰数字存储库对3D数据存储项目的开展情况可知,以3D数据为代表的新型数据形式存储已经成为现阶段数字信息存储研究的重要内容。随着数据综合分析处理的能力不断提高,以及诸如爱尔兰数字存储库等机构不断的推陈出新,相信我们一定能解决3D数据存储目前存在的硬软件设备不过关、3D数据包技术不成熟等问题,从而确保3D数据的有效归档和充分利用。
案例思考题
如何确保新型数据的元数据得以有效保存?
在目前的数字存储环境中,新型数据归档存储面临的最大问题是什么?
档案机构如何及时针对不同类型的数据做好长期保存工作?
来源:2021.05.23 国际档案理事会微信公众号