每天互联网上都有1EB的数据被创建,这相当于2.5亿张DVD的容量。同样ZB也不是很遥远 —— 计算每年互联网传输的数据总量时就会用到。Cisco估算在2016年互联网传输总量将达到1.3ZB,所以用不了多久我们就要谈论更高级别的数据了。
大数据科学家用来讨论政府数据(FBI或NSA汇总的公民数据)时,YB 代替了ZB。如果用DVD进行储存,1YB数据需要250万亿张DVD。虽然已经够大了,但是我们还得考虑更高级别的计算机存储单位。在此要特别感谢 Shantanu Gupta(Intel公司Connected Intelligent Solutions总监)演讲里提到的下一代超越YB的计算机存储单位概念 —— Brontobyte与Gegobyte。
Brontobyte(10后面跟了27个0)虽然还没有正式的成为SI前缀,但是已经被广泛任何。Gupta用它来描绘从物联网获得的数据。而Gegobyte则是10后面有30位的0。对于这样的计量单位,再用多少DVD来形容已经好无意义;但是可以肯定的是这么多DVD,是绝对无法在人的一生中看完的。
为了更形象的描述这些汇集的数据,Gupta提供了如下统计(注:CERN、SKA以及发动机传感器的情况下,可能不是所有的数据都需要保存):
- YouTube上每分钟上传的视频长度大约在72小时,转码量大约是4分钟1TB。
- Facebook数据库每天存入的数据大约在 500 TB。
- CERN大型强子对撞机每秒生成数据量约为1PB。
- 建设中的下一代巨型射电望远镜阵SKA每天生成的数据大约在1EB。
- 波音发动机上的传感器每小时产生20TB左右的数据。
随着数据总量的暴增,数据的实时分析和处理无疑越加的捉襟见肘。然而如果这个问题得不到快速的改善,那么某些情况下:1TB与1GB带来的价值就没有什么不同了。 (编译/@CSDN仲浩)