simon曦 2018-08-29
毫不奇怪,大数据分析和人工智能的发展为企业提供了强大的未来预期,以提升有关其业务的每个可衡量方面的信息。现在,相关法规要求企业保留的记录时间比过去更长。
研究显示,记录的数据量每年增加30%至40%。与此同时,用于存储大部分数据的现代硬盘的容量增长率不到这一速度的一半。幸运的是,大部分信息不需要立即访问。对于这样的情况,磁带是完美的解决方案。
实际上,世界上大部分数据仍然保留在磁带上,包括基础科学数据,如粒子物理和天文学,人类遗产和国家档案,主要电影,银行,保险,石油勘探等。甚至还有一群人,他们的工作就是不断改进磁带存储。
磁带已存在很长一段时间了,但该技术尚未终结。恰恰相反。像硬盘和晶体管一样,磁带在过去几十年中取得了巨大进步。
第一个商用数字磁带存储系统是IBM的Model 726可以在一卷磁带上存储大约1.1兆字节。今天,现代磁带盒可容纳15TB。一个机器磁带库最多可包含278 PB的数据。在光盘上存储大量数据将需要超过3.97亿个,如果堆叠将形成超过476公里高的塔。
确实,磁带不能提供硬盘或半导体存储器的快速访问速度。不过,媒介的优势很多。首先,磁带存储更节能:一旦记录了所有数据,磁带盒就会安静地放在磁带库的插槽中,根本不消耗任何电能。磁带也非常可靠,错误率比硬盘低四到五个数量级。磁带非常安全,具有内置的动态加密和介质本身提供的额外安全性。毕竟,如果磁带未安装在驱动器中,则无法访问或修改数据。鉴于通过网络攻击导致的数据窃不断增长,这种优势尤其具有吸引力。
磁带的离线特性还为有缺陷的软件提供了额外的防线。例如,在2011年,软件更新中的一个缺陷导致Google意外删除了大约40000个Gmail帐户中保存的电子邮件。尽管在多个数据中心的硬盘上存储了多个数据副本,但仍然发生了这种损失。幸运的是,数据也记录在磁带上,谷歌最终可以从该备份中恢复所有丢失的数据。
2011年的Gmail事件是云服务提供商首次使用磁带进行操作的事件之一。最近,微软让人们知道它的Azure归档存储使用IBM磁带存储设备。
图:1951年:磁带首先用于在计算机(Univac)上记录数据。
尽管如此,企业使用磁带的主要原因通常是简单的经济学。磁带存储的成本是硬盘上保持相同数据量所需成本的六分之一,这就是为什么你几乎可以在任何存储大量数据的地方找到磁带系统的原因。但由于磁带现在完全从消费级产品中消失,大多数人都不知道它的存在,更不用说磁带录制技术近年来取得的巨大进步,并将在可预见的未来继续发展。
所有这一切都是说磁带已经存在了几十年,并将在未来几十年内存在。怎么能这么肯定?
磁带只要有一个根本原因就能存活下来:它很便宜。而且它一直在变得越来越低成本。但总会如此吗?
你可能期望,如果将更多数据塞入硬盘的能力正在减少,那么对于使用相同基本技术但更老的磁带来说也是如此。令人惊讶的现实是,对于磁带而言,这种容量的扩大并没有显示出放缓的迹象。事实上,它应该以每年约33%的历史速度持续多年,这意味着你可以预期大约每两到三年就会增加一倍的容量。可以把它想象成摩尔定律的磁带。
对于那些必须应对存储预算数据爆炸性增长的人来说,这是个好消息。要了解为什么磁带仍然具有相对于硬盘的潜力,请考虑磁带和硬盘的发展方式。
两者都依赖于相同的基本物理机制来存储数字数据。它们以磁性材料薄膜中的窄轨道的形式这样做,其中磁性在两种极性状态之间切换。该信息被编码为一系列比特,由沿轨道的特定点处的磁极过渡的存在或不存在来表示。自20世纪50年代引入磁带和硬盘以来,两者的制造商一直受到“更密集,更快,更便宜”的口号驱使。结果,以每千兆字节容量计算的两者的成本已经下降多个数量级。
这些成本降低是可以记录在磁性基板的每平方毫米上的信息密度的指数增加的结果。面密度是沿数据轨道的记录密度和垂直方向上这些轨道的密度的乘积。
早期,磁带和硬盘的面密度相似。但更大的市场规模和硬盘销售收入为更大规模的研发工作提供了资金,这使得他们的制造商能够更积极地扩大规模。因此,大容量硬盘的当前面密度约为最新磁带的100倍。
尽管如此,由于它们具有更大的可用于记录的表面区域,因此最先进的磁带系统可提供高达15 TB的本机盒式磁带容量,而不是市场上容量最大的硬盘。即使两种设备占用大约相同的空间,也是如此。
内部和外部:现代线性磁带开放(LTO)磁带盒由单个卷轴组成。插入盒式磁带后,磁带自动送入驱动内置的卷轴。
除容量外,磁带和硬盘的性能特征当然是非常不同的。盒式磁带中的长带,通常为数百米,导致平均数据访问时间为50到60秒,而硬盘的平均数据访问时间仅为5到10毫秒。但是,令人惊讶的是,将数据写入磁带的速率是写入硬盘速度的两倍多。
在过去几年中,硬盘上数据的面密度缩放已从其历史平均值每年约40%放缓至10%至15%之间。原因与一些基本物理有关:要在给定区域中记录更多数据,你需要为每个位分配一个较小的区域。这反过来会减少你阅读时可以获得的信号。如果你过多地减少信号,它会因磁盘上涂有磁性颗粒的粒状特性而产生噪音。
通过减少这些颗粒,可以减少背景噪音。但是很难将磁性颗粒缩小到一定的尺寸而不会损害它们以稳定的方式保持磁性状态的能力。用于磁记录的最小尺寸在该业务中被称为超顺磁极限。而硬件制造商已经做到了。
直到最近,这种放缓对消费者来说并不明显,因为硬盘制造商能够通过为每个单元添加更多的磁头和盘片来进行补偿,从而在相同尺寸的封装中实现更高的容量。但现在,可用空间和增加更多磁头和盘片的成本限制了制造商可以获得的收益。
正在开发的一些技术可以使硬盘扩展超出当今的超顺磁极限。这些包括热辅助磁记录(HAMR)和微波辅助磁记录(MAMR),这些技术能够使用较小的颗粒,从而允许磁盘的较小区域被磁化。但这些方法增加了成本并引入了令人烦恼的工程挑战。即使它们是成功的,根据制造商的说法,它们提供的扩展可能仍然有限。例如,西部数据最近宣布它将在2019年开始出货MAMR硬盘,预计该技术将使面密度每年仅增加约15%。
相比之下,磁带存储设备目前以远低于超顺磁极限的面密度工作。因此,磁带的摩尔定律可以持续十年或更长时间,而不会遇到基础物理学的这些障碍。
磁带是一种棘手的技术。它的可拆卸性,使用薄的聚合物基板而不是刚性盘,并行同时记录多达32个轨道,为设计人员带来了重大障碍。这就是为什么我在IBM Research-Zurich实验室的研究团队一直在努力寻找能够通过调整硬盘技术或发明全新方法来实现磁带持续扩展的方法。
2015年,我们和FujiFilm公司的合作伙伴表示,通过使用垂直于胶带定向的超小型钡铁氧体颗粒,可以将数据记录为当今商业技术可达到的密度的12倍以上。最近,与索尼存储媒体解决方案合作,我们展示了以面密度记录数据的可能性,该密度是目前最先进磁带数量的20倍。为了正确看待这一点,如果要将这项技术商业化,那么现在可能需要十几个磁带盒来存档大预算功能的所有数字组件的电影工作室,能够将所有这些技术整合到一个单一的胶带。
图:现代磁带库可容纳数百PB,而1952年推出的IBM 726可存储几兆字节。
为了实现这种程度的扩展,我们必须做出一系列技术进步。首先,提高了读写磁头跟随磁带上细长磁道的能力,在最新的演示中,磁道只有100纳米左右。
我们还必须减小数据读取器的宽度:用于读回记录数据轨道的磁阻传感器,从其当前的微米尺寸到小于50纳米。结果,我们用这么小的读卡器拾取的信号非常嘈杂。我们通过增加介质固有的信噪比来补偿,这是磁性颗粒的尺寸和取向以及它们的组成以及磁带表面的光滑度和光滑度的函数。为了进一步提供帮助,我们改进了设备所采用的信号处理和纠错方案。
为了确保我们的新原型介质能够保留记录数据数十年,我们改变了记录层中磁性颗粒的性质,使其更加稳定。但是这种改变使得首先记录数据变得更加困难,以至于普通的磁带传感器无法可靠地写入新媒介。因此,我们使用了一种特殊的写头,可以产生比传统磁头强得多的磁场。
结合这些技术,我们能够在我们的实验室系统中以每英寸818000位的线性密度读取和写入数据。(由于历史原因,世界各地的磁带工程师以英寸为单位测量数据密度。)结合新技术可以处理的每英寸246200磁道,我们的原型单元的面密度达到每平方英寸201千兆位。假设一个墨盒可以容纳1140米的胶带,这是一个合理的假设,基于我们使用的新磁带介质的厚度减小,这种面密度对应于高达330 TB的墨盒容量。这意味着单个磁带盒可以记录与装满硬盘的独轮车一样多的数据。
在2015年,在信息存储产业联盟,包括惠普企业,IBM,甲骨文和Quantum,与学术研究团体发布了所谓的“国际磁带存储路线图。”这一预测预测,到2025年,磁带存储的面密度将达到每平方英寸91 Gb。根据趋势推断,到2028年它将超过每平方英寸200 Gb。
该路线图的作者都对磁带存储的未来感兴趣。但你不必担心他们过于乐观。我和我的同事最近进行的实验室实验表明,每平方英寸200 Gb是完全可能的。因此,在我看来,保持磁带在至少十年的增长路径上的可行性是非常有把握的。
实际上,磁带可能是遵循摩尔定律规模扩展的最后一种信息技术之一,在未来十年内,即使不是超越,也能保持这种技术。而这种连续性反过来只会增加磁带相对于硬盘驱动器和其他存储技术的成本优势。
本文作者:Mark Lantz,IBM Research Zurich的高级磁带技术经理
文章译自:IEEE.org