数字兰台〈〈〈SHUZILANTAI D01:10.16565/jki.l006-7744.2021.05.22大数据时代电子文件备份技术探析 赵晓慧
摘要可靠的海量数据备份能力及技术方式是档案信息化管理的基:和保障。根据档案信息自身特D及信息技术发展趋势,海量数'备份技术的发展前景可以构想,例如档案数'随时随地云备份、档案数据备份逐渐智能化、备份虚拟化技术继续优化、备份介质不断更新迭代、备份技术更加细化等。 关键词信息存储档案备份技术大数据虚拟化技术
中图分类号G273.3文献标识码A收稿日期2021-01-19
★作者简介:赵晓慧,辽宁省金秋医院馆员,研究方向为档案管理。
Analysis of Electronic Documents Backup Technology in the Big Data Era
Zhao Xiaohui
苯甲酸乙酯的制备Abstract Reliable mass data backup ability and technology is the basis and guarantee of archives infor
matization management. According to the characteristics of archives information and development trend of information technology,the development prospects of mass data backup technology can be conceived,such as cloud backup of archives data anytime and anywhere,gradual intelligentization of archives data backup,continual optimization of backup virtualization technology,constant updating of backup media,more refined backup technology,etc.
Keyword information storage;archives;backup technology;big data;virtualization technology
当今世界网络、移动设备、通信等各类现代信息技术高度发达,在各行各业中的实际应用中也逐步普及,应该说我们已然进入大数据时代,随之而来的各类数据集合也爆炸式增长和高度复杂化。在此影响下,档案 数字信息海量增长成为现实[1],因此档案管理全面实现信息化不仅是一种趋势,还是档案管理事业向信息化发展的一股强而有力的新动力。然而由于信息技术的自身弱点、安全威胁类型多、来源多,档案部门技术局限性等多种因素的影响,这些海量数字档案信息的真实及长 面的全威胁化大数据发趋势
在式技术面面大
题和全新的挑战。
的海量数据及技术式是档案信息化管理的和,是档案全,不
档案的,影响档案信息化发展进程叫就目前而言,档案界针对海量数据备份技术面的在实中,据档案信息及信息技术发趋势,大数据
境下档案信息数据备份技术的发展及应用前景。
78!兰台世界LANTAI WORLD
一、档案数据云备份
云备份是云计算、大数据等最新信息技术的融合或延伸发展,是超融合存储架构,是通过整合虚拟化、应用网络技术各现代信息技术,通
平台将其集合起来协调工作,共同提供数据存储和访问功能的综合系统。
技术应用在档案数据存储与备份工作中,能够有效解决档案海量数据存储问题,云存储有储存容量大、资源存取方便、成本低等特点,随时随地可存储、可访问,打破了空间、时间、设备的限制,可为档案信息化管理提供稳定、可靠的存储空间,更好地保护数据安全、规避安全风险和提供快捷海量数据查询,并且能够使档案工作者打造高效的服务体系。通过云端快速部署拓的特点,便于档案信息 化适应信息技术发展,降低试错成本,同时也便于不同区域档案管理者通过私有云整合优势资源,建立统一备份及利用平台,实现档案信息资源实时共享和提升容灾备份能力。触摸笔
二、档案数据备份智能化
传统档案数据备份模式重点关注数据的安全性、
可恢复性、可用性,在现代信息技术发展趋势下,特别是智能化备份模式的出现,使我们在此基础上对海量数据备份的效率、方便性、自动化、自适应、兼容性、自治管理等方面有了更多期待,也正切合当前人工智能发展理念。智能化备份核心理念是:通过对系统数据资源及设备进行实时分析、监控和数据挖掘,根据数据应用特点结合使用者的行为模式,将备份数据进行动态智能化调整和配置,使备份模式达到最佳的运行状态。
在电子文件备份过程中,我们可以应用智能化存数据技术,数据的分、合、、
等工合进行化管理通过智能化备份的信息资源,在进行信息时更效,人工在智能数据理上也可分析理化信息信息,有展信息资源混凝土垫块
前,智能化在及行有应用,
如档案信息自动分AST)在各种形式的
储之间移动数据,数据卷大小自动调整,文件系统自动设数据,数据自动复,数据自动
等。但智能化在行业整体应用水平目前还很低,巨容量性能、可用性的系统实现管理清烟器
复
三、备份虚拟化技术不断发展
试验平台
化备份是理中的信息资源进行化容备份的技术系统,能对理中的硬件配置、操作系统、数据库、应用软件及文档等数据通过VMware、Hyper-V、Hyper-V等虚拟化应用系统进行模,使有数据资源实的件系统能够原貌呈现或读取,从而实现备份保护数据的目的。该项技术可以根据需求虚拟多个系统环境,并且每个系统都可以独立运算、存储、提取,在执行备份操作时,根据设置的计划任,可自动完成信息资源的比对、差异、增量或完整备份。对于用户来讲,无需关心后台存储环境,信息资源在前台与物理设备现的效果一样。
现在虚拟备份技术发展较快,也较为成熟,由于其在应用过程中操作简单、效率较、兼容性好,能够避免因硬件、操作系统、软件或人为错误而造成的数据丢失,并且虚拟化技术还可以降低软硬件应用成本和系统维护的费用,因此当前在行、各领域应用十分流行。而这些特,也正切合当下档案工作中对于高度异构化、复杂化电子文件存储及备份要求,既可以脱离原生系统平台,又能原貌形式保存这些电子文件,符合确保电子文件长期可用、可读性需求,是电子文件海量数据存储和备份的又一个重要发展方向。
四、备份介质不断更新迭代(Backup Medium)
档案数据备份介质随信息设备发展不断更新,从最初的软盘、光盘、蓝光光盘、光盘塔,到磁带库、磁盘阵列不涌现,并在各个不同工场景不同时期得到应用,一些介质,如软盘、磁带等,因其价格低廉、易用,在20世纪90年代十分普及,随着光介质的出现,与光介质相比,其支持机械元件的可靠性及读写速度有明显劣势,因此此类介质已经被淘汰;随着更新的存储技术发展,目前光介质在应用和发展过程中也出现被易用的磁介质逐步替代的趋势,但也不代表这些介质,需要我们据具需求而,根据未来技术发展来选择。就档案备份介质而言,档案工作者一般注重容量和长期可用性,随着数
业务规模逐步拓展、数据量的,对介质的存取效率、方便性有了更的要求前,应用较的介质是阵列、带、带等
近年来,固态硬盘(SSD,Solid State Disk)因其在度、性、率、等方面较统
硬盘(HDD,Hard Disk Drive)有很大优势,在系统应用管理中快的应用发展,有替代统机械硬盘的趋势,但目前固态硬盘还存在多个缺点,如价格相对高、不易数据恢复、读写抖动性大等,而随着技术的,这些也都在不就性能数据备份性,是通过
读信息,在或运
过程中容易造成盘片的或数据的丢失,件多而复杂,受自然环境中灰尘、温湿度等影响极易受
有实而由成电
制成,没有机械运动部件,无需寻址,读取速率快,体积小、重量轻,抗震性更好,对数据保护能力更强,能够适应更广的使用环境。因此,固态硬盘应用于电子文件海量数据备份领域可期,我们应该重
五、备份新技术不断细化发展
前流行的备份技术有分式、智能系统、数据等,这些技术在合备份管理工作中有所研究和应用。同时,随着虚拟化等新技术
LANTAI WORLD兰台世界!79
的快速普及、应用呈现出的新特征,备份产品在保留了传统的技术和新衍生云灾备等方案之外,又有一些技术已成为或者可能成为新的热点[3],对于解决虚拟化和大数据存储备份工作的数据管理难题有所帮助,在研究部署档案备份策略中可以借鉴。
1.重复数据删除。重复数据删除是通过算法针对备份数据进行压缩或缩减的技术。海量数据备份过程
中是大量的冗余数据,备份过程中也不例外,重复数据删除技术为我们提供了解决方案。当前主流重复数据删除技术方法通常是于I (hash)的方法,通过类似SHA-1&MD-5算法来判断数据是已备份或是于的数据式,用内嵌在备份数据中的元数据进行差异备份。同,重复删除技术数据技术,化或大
。我们对档案进行甄别筛选和对数据进行备份,除大重复数据
技术。该项技术可以帮助我们降低数据存储,提高存储备份效率,节省成本等。数据重复删除技术
了备份所的存储,现了快和的备份,从而有利于存储。
2.即时恢复。即时恢复技术是指出现虚拟机宕机(丢失、不可用、灾害发生)时,可以在备份存储上即时复虚拟行,现数据的和的。重的统对服提出的在,当灾生
现数据的即时原貌恢复,能够有相同的虚拟机立即投入使用。当前已出现基于持续数据保护(CDP)和快照等基础备份功能的即时恢复方案,对于一些重要的业务系统中流转的电子文件,我们可以应用该项技术实现备份和复,提备份的
和有效性。
3.细粒度恢复。该技术是通过虚拟化平台解析所备份的文件系统,精准恢复单个文件级的技术。通常
水泥砖制砖机在灾害发生时,很大概率的故障原因为软故障,即只有部分数据受到损坏,例如单个配置文件、部分文件等,如果已备份好的数据整体恢复则大人力、物力和时间,通过细粒度索引指针等技术方式,则无需恢复整个备份数据,即可快速地访问指定或者某个目录文件,精确复数据,能够极大提升数据恢复效率。当灾难发生时,我们可以高效地进行电子文件数据迁移和数据恢复,可小恢复整个备份数据时对生产环境、备份环境的运行压力,同时节省数据恢复成本,缩短业务中断时间,尽快恢复业务运行。
总之,档案作为不可再生信息资源,是国家机构、社会组织或个人在社会生活中直接形成的、有价值的、各种形式的历史记录,是人类社会重要的文化遗产。确保电子文件信息在当大数据环境下的可靠性和可用性,是当前工作重点和重要研究方向。同时,电子文件大数据备份是一项系统工程,要根据自身基础设施、网络系统、现有备份系统、电子文件处理系统、灾难恢复预案、运维管理能力、未来可扩展性、对效率要求以及技术支持能力等方。
参考文献
[1]许桂清.电子档案异地异质备份现状及应对[J].档案学研究,2018(1).
[2]谷海力.刘焕鑫到辽宁省档案馆电子档案备份中心调研[J].兰台世界,2019(6).
[3]上海爱数信息技术股份有限公司.信息系统数据备份与恢复发展趋势[J].保密科学技术,2016(1). 80!兰台世界LANTAI WORLD