>>分享SPSS,Hadoop等大数据处理技术,以及分布式架构以及集群系统的构建 书籍支持  卫琴直播  品书摘要  在线测试  资源下载  联系我们
发表一个新主题 开启一个新投票 回复文章 您是本文章第 19938 个阅读者 刷新本主题
 * 贴子主题:  大数据存储单位介绍(TB、PB、EB、ZB、YB有多大) 回复文章 点赞(0)  收藏  
作者:Jacky    发表时间:2020-03-30 19:46:25     消息  查看  搜索  好友  邮件  复制  引用

                                    

大数据存储单位介绍(TB、PB、EB、ZB、YB有多大)

     “大数据”作为时下最火热的IT行业的词汇,随之数据仓库、数据安全、数据分析、数据挖掘等等围绕大数量的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。笔者愚钝,大数据有多大,一直没有清晰的概念,故此简单的科普研究,分享至此: 

         最小的基本单位是Byte应该没多少人不知道吧,下面先按顺序给出所有单位:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB

         我只知道前五个,估计大多数人都知道吧,按照进率1024(2的十次方)计算:

         1Byte = 8 Bit

         1 KB = 1,024 Bytes 

         1 MB = 1,024 KB = 1,048,576 Bytes 

         1 GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes

         1 TB = 1,024 GB = 1,048,576 MB = 1,073,741,824 KB = 1,099,511,627,776 Bytes

         1 PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes

         1 EB = 1,024 PB = 1,048,576 TB = 1,152,921,504,606,846,976 Bytes

         1 ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes

         1 YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes

         在计算的时候,发现XP自带的计算器根本没办法算了,不得又重下了个能算的计算器。

         光看这些数字估计你没什么感觉,那现在就算点好想象的吧,下面拿NB为例

         在现阶段的TB时代,1TB的硬盘的标准重量是670g

         1NB=2的60次方TB=1152921504606846976TB=1152921504606846976个1TB硬盘

         总重量约为77245740809万吨 目前运载量为56万吨的 诺克耐维斯号 巨型海轮

         也就是说 储存1NB的数据的硬盘要 诺克耐维斯号 最少来回拉 1 379 388 229 次 约14亿次才能将这些数据运到地点,估计1000个诺克耐维斯号都要报销。

         如果以上地数据过于庞大,还是找不到感觉,那么给个实际的数据:计算机报上看到荷兰银行的20个数据中心有大约7PB磁盘和超过20PB的磁带存储,而且每年50%~70%存储量的增长,计算一下27PB大约为 40万个80G的硬盘大小。

         半导体行业的摩尔定律似乎还不足以形容数据增长的快速性,大数据量的环境下促生技术的变革和进步,Hadoop技术、敏捷商业智能等等随之出现的解决方案似乎有望为大数据问题带来些许曙光。    

KiB、MiB与KB、MB的区别

名字 缩写 次方 名字 缩写 次方
kilobyte KB 10^3 kibibyte KiB 2^10
megabyte MB 10^6 mebibyte MiB 2^20
gigabyte GB 10^9 gibibyte GiB 2^30
terabyte TB 10^12 tebibyte TiB 2^40
petabyte PB 10^15 pebibyte PiB 2^50
exabyte EB 10^18 exbibyte EiB 2^60
zettabyte ZB 10^21 zebibyte ZiB 2^70
yottabyte YB 10^24 yobibyte YiB 2^80



        
----------------------------
原文链接:https://www.cnblogs.com/daysme/p/12162572.html

程序猿的技术大观园:www.javathinker.net



[这个贴子最后由 flybird 在 2020-03-30 19:46:25 重新编辑]
  Java面向对象编程-->Java注解
  JavaWeb开发-->Web运作原理(Ⅱ)
  JSP与Hibernate开发-->使用JPA和注解
  Java网络编程-->Java反射机制
  精通Spring-->Vue组件开发基础
  Vue3开发-->绑定CSS样式
  一套可复用的方法论!从0-1搭建数据团队,看这篇就够了
  害阿里程序员差点被当场开除的P0事故
  实战SparkStream+Kafka+Redis实时计算商品销售额
  kubernetes之Ingress部署
  TiDB在360的落地及实战干货
  MapReduce实现自定义排序功能
  如何面对高并发?缓存?中台为什么会火?
  Spark SQL常见4种数据源(详细)
  通过Spark Streaming的foreachRDD把处理后的数据写入外部存储...
  Spark On YARN 环境搭建
  Hadoop 分布式存储系统 HDFS的实例详解
  大数据项目之仿天猫数据分析
  Hadoop设计思路和目标
  用Maven构建Hadoop项目
  数据仓库的两种建模方法
  更多...
 IPIP: 已设置保密
树形列表:   
1页 0条记录 当前第1
发表一个新主题 开启一个新投票 回复文章


中文版权所有: JavaThinker技术网站 Copyright 2016-2026 沪ICP备16029593号-2
荟萃Java程序员智慧的结晶,分享交流Java前沿技术。  联系我们
如有技术文章涉及侵权,请与本站管理员联系。