Las primeras computadoras no tenían memoria, solo procesaban datos de entrada y entregaban datos de salida. La primera computadora en incluir memoria fue el UNIVAC en 1951, que tenía apenas 12 kilobytes de memoria, ¡un millón de veces menos que un teléfono actual!
Pero ¿cómo se miden los datos? ¿qué significan kilobytes, megabytes o terabytes? ¿y qué otras unidades existen? Hoy lo vas a aprender en EDteam, porque la tecnología no es difícil, te están enseñando mal.
Y por cierto, muy pronto llega el EDweekend 2023 a EDteam: son 3 días con grandes descuentos para le pierdas el miedo a la tecnología. Regístrate en ed.team para obtener acceso anticipado a todas las promociones. ¡No te lo pierdas!
De los bits a los bytes
Como debes saber (o deberías) las computadoras solo entienden ceros y unos, el famoso código binario que te explicamos en este blog. Para resumir, todo lo que haces en una computadora debe ser convertido a ceros y unos para ser procesado. Esto llevó a definir la unidad básica de la información: el bit, cuyo nombre proviene de BInary DigiT, término acuñado por John Tukey en 1948.
Sin embargo, un bit solo puede ser cero o uno. No puede ser una letra "a", el número "5" o un signo de interrogación "?". Así que, ¿cómo hacemos para representar estos símbolos que son básicos para nuestra comunicación si el bit no es capaz?
La respuesta es agrupar varios bits en una nueva unidad llamada byte, que ya no tiene solo dos valores, sino 2 elevado a la cantidad de bits. Por ejemplo:
- Un byte de 4 bits tendría 2 ^ 4 = 16 valores
- Un byte de 5 bits , 2 ^ 5 = 32 valores
- Un byte de 6 bits, 2 ^ 6 = 64 valores
- Un byte de 7 bits, 2 ^ 7 = 128 valores
- Un byte de 8 bits, 2 ^ 8 = 256 valores
Ya sé qué estás pensando: “¿bytes de 5 bits? ¿qué está fumando Álvaro?” Pues sí, recuerda que estamos a finales de la década de 1940 y que hasta la década del 60, no había un estándar casi para nada, y cada computadora funcionaba según a su modo, sin compatibilidad entre ellas. Así que cada fabricante implementaba los bits a su modo.
En 1963 se definió un estándar que cambió todo: ASCII (American Standard Code for Information Interchange) que usaba 7 bits (sí, leíste bien, 7 bits) para representar 128 caracteres entre letras, números, símbolos y caracteres invisibles de control. Si alguna vez presionaste alt + 64
para escribir @
, usaste el código ASCII.
Aunque ASCII fue ampliamente aceptado como un estándar para codificar los caracteres, varias compañías estaban usando bytes de 8 bits. Así que el byte de 8 bits se convirtió en estándar, los demás bytes desaparecieron y ASCII usó el octavo bit como bit de paridad (es decir, un bit de comprobación para asegurar que la información sea correcta). En otras palabras, siguió siendo de 7 bits (128 caracteres) en un mundo de 8 bits.
El estándar que se usa actualmente no es ASCII, sino Unicode, que incluye a ASCII, soporta cualquier alfabeto, no solo el latino e incluye a los emojis. Sí, tus emojis de corazón o de carita llorando no son imágenes en JPG o PNG, sino caracteres Unicode. Aunque ese es tema para otro blog.
Como curiosidad, te cuento que si has visto una página web o aplicación con caracteres raros donde debería ir una "ñ" o una vocal con tilde, se debe a que no se definió correctamente el estándar unicode. En HTML esto se resuelve agregando en <meta charset="UTF-8">
dentro de la etiqueta <head></head>
.
Si quieres saber más de HTML y aprender a crear páginas web, tenemos el mejor curso en español en EDteam. Comienza a estudiarlo gratis y comprueba que la tecnología no es difícil, te están enseñando mal.
Y después de toda esta historia, ya debe quedarte claro porque se usan bytes (y no bits) para medir el almacenamiento en las computadoras. Como dato, cuando tu proveedor de internet te vende un plan de 100 megas, son megabits, no megabytes. Y si estuviste atento, seguro entiendes que están en lo correcto y no te están estafando.
Así que ahora veamos que es eso de megabytes, gigabytes, terabytes, petabytes y demás. Por cierto, a partir de aquí, las siguientes unidades se calculan multiplicando la unidad anterior por 1024 (que es 2 ^10).
Del kilobyte al terabyte
Empezamos este recorrido por las unidades que más usamos las personas como tú y como yo, y seguro ya has escuchado hablar de ellas. Luego, hablaremos de las unidades gigantes, que solo usan las grandes empresas.
Kilobyte (KB)
Un kilobyte son 1024 bytes. Si estuviste atento al blog, sabes que un carácter es un byte, por lo que un archivo de texto plano de 1024 caracteres, pesará 1KB, lo cual da aproximadamente 800 palabras. Haciendo las matemáticas, el Quijote de la Mancha, con aproximadamente medio millón de palabras, ocuparía unos 2500 kilobytes.
Entonces, te sorprenderá saber que la primera computadora de la historia en incluir almacenamiento (el UNIVAC en 1951) tenía apenas unos 12KB de memoria. Ahí no entra ni un archivo de Word. Pero era suficiente para ese tiempo.
Casi veinte años después, en 1970, se lanzó el primer dispositivo de almacenamiento externo y portable: el disquet de 8 pulgadas con capacidad para 150KB y con el tamaño de un disco pequeño de vinilo.
Otro dato es que el logo en PNG de una web pesa alrededor de 5KB. Ten en cuenta las imágenes son los recursos que más peso le agregan a tu página web y mientras menos pesen, más rápido cargará la página. Si quieres saber cómo optimizar las imágenes para tu web, no te pierdas este video de YouTube.
Megabyte (MB)
Luego tenemos al megabyte, que son 1024 kilobytes. En la década de los 80, se lanzó el famoso disquete de 3.25 pulgadas, que tenía capacidad para 1.44MB, y fue el estándar por casi toda una década.
A finales de los 90, eran tiempos de Napster, no existía de Facebook y pocos habían escuchado hablar de Google. Una canción en MP3 pensaba entre 2 a 3MB, así que no entraba en ningún disquete.
En la década de los 90 aparecieron, también, los discos ZIP con capacidades de varios cientos de megas, que dejaban en ridículo a los 1.44MB de los disquetes, pero estos discos eran caros y requerían un lector externo, así que nunca los vi más que en fotos.
Gigabyte (GB)
Seguimos con el gigabyte, que son 1024 MB. A finales de los 90, parecía una cantidad absurda de almacenamiento. Recuerdo que en el 2004, mi jefe llevaba una memoria USB de 256MB colgada del cuello, como signo de estatus. Había que tener mucho dinero para tener una de esas.
Pero hoy, un gigabyte no alcanza casi para nada. Un video de EDteam de 10 minutos, listo para subir YouTube en full HD, pesa alrededor de 1GB (4GB si es en 4K).
Y según datos de Netflix, una hora de película en HD consume 1GB de datos y en 4K hasta 7GB. Y te preguntarás: ¿no que 10 minutos en HD era 1GB? Pues sucede que Netflix, YouTube y todas las plataformas de video trabajan muy duro en sistemas de codificación para comprimir los videos al máximo sin degradar la calidad. Si no lo hicieran, no podrías ver fluidos sus videos porque pesarían demasiado y tu conexión a Internet no aguantaría.
Terabyte
Entonces llegamos a los terabytes que son 1024 gigabytes y eso es mucha capacidad: una computadora o teléfono con 1TB de almacenamiento interno son dispositivos bastante costosos, por eso muchos prefieren usar discos externos o la nube para ampliar el almacenamiento.
En 1TB podemos grabar 80 horas de video en 4K con un teléfono. O 5 horas sí usamos una cámara profesional. En 1TB entran más de un cuarto de millón de fotos en JPG. 1TB es tan grande que es la unidad máxima que usamos las personas, por eso, servicios en la nube como Dropbox, Google One, OneDrive de Microsoft o iCloud de Apple tiene de 2TB a 6TB de almacenamiento en sus planes más costosos.
Mi computadora personal (en la que grabamos en EDteam los videos para nuestro canal de Youtube) tiene 256GB de almacenamiento (un cuarto de terabyte). Obviamente, tengo un disco externo de 1TB y varios teras de datos en la nube.
Del petabyte al infinito
A partir de aquí hablaremos de unidades tan grandes que se requieren cantidades enormes de dinero y de poder de cómputo para trabajar con ellas, por lo que están reservadas para grandes empresas.
Petabyte (PB)
Comenzamos las grandes ligas con el petabyte que son 1024 terabytes. Ningún ser humano en 2023 necesita 1PB de almacenamiento. Solo las grandes empresas, ni siquiera EDteam necesita 1PB. Estamos hablando de un millón de gigabytes, ¡16 años de películas en 4K sin parar!
Para que te hagas una idea, el catálogo completo de Netflix pesa alrededor de 10PB. Y aunque es una cifra gigantesca, al día de hoy se calcula que se mueve 1PB de datos por segundo (sí, por segundo) en internet.
La cantidad de datos que generamos incluso sin hacer nada (mientras nuestros dispositivos miden nuestro pulso o rastrean nuestra ubicación geográfica) es tan grande que para entrenar a GPT3 se estima que se necesitaron varios PB de datos. Aunque la cifra exacta no es pública y quizás jamás lo sea (como el algoritmo de Google o la receta de la Coca Cola).
Exabyte (EB)
La siguiente unidad es el exabyte que son 1024PB. Si consideramos que hay miles de millones de personas en el mundo usando redes sociales, viendo videos, haciendo transmisiones, enviándose mensajes, publicando información; además de sensores, internet de las cosas y dispositivos que generan datos sin intervención humana, los petabytes no bastan para esa cantidad brutal de datos.
Hace unos años las grandes empresas (como Google o Amazon) movían datos a niveles de petabytes y era impresionante, pero como ya te dije, los petabytes no bastan y ahora trabajan con exabytes.
Como referencia, en un exabyte entran aproximadamente 140 mil películas de Netflix en 4K. ¡10 veces la cantidad total de su catálogo! Si consideramos que su catálogo está renderizado en diferentes niveles de compresión y tiene múltiples copias distribuidas por CDN en el mundo, fácilmente puede superar el exabyte, solo en su catálogo, sin contar el resto de información que maneja.
Zettabyte (ZB) y Yottabyte (YB)
El nivel más alto en la actualidad es el zettabyte, que son 1024 exabytes. Es una cantidad tan grande que [se estima que toda la información del mundo en 2023 es de unos 150ZB] y más de la mitad de esos datos son generados por IoT o internet de las cosas, es decir, sin intervención humana.
La siguiente unidad es el yottabyte que son 1024ZB, pero considerando que ni toda la información del mundo alcanza ese nivel, el yottabyte es aún una cantidad teórica. Al paso que vamos posiblemente en unos años las grandes empresas trabajen con zettabytes y las personas tengan computadoras personales con petabytes de almacenamiento.
Y perros robots saludándonos al llegar a casa y amigos imaginarios con los que conversamos a través de lentes.
¿Por qué usamos prefijos decimales?
Una pregunta que muchos se hacen (y que seguro te habrás hecho si es la primera vez que ves este tema) es por qué se usan prefijos decimales como kilo, mega o giga para unidades que son binarias. Por ejemplo, un kilobyte debería significar 1000 bytes, no 1024. ¿Por qué sucede esto?
Para explicarlo primero debemos recordar que a nosotros se nos hace más fácil contar y hacer cálculos en el sistema decimal pero a las computadoras no, sino que prefieren el sistema binario de solo ceros y unos para sus cálculos. Si quieres saber a fondo el por qué, tenemos un blog en EDteam.
El punto es que aunque los bits (ceros y unos) y los bytes (ocho bits) son unidades del sistema binario, para las siguientes unidades se “tomaron prestados” los prefijos del sistema decimal, o para ser exactos del Sistema Internacional (SI) a falta de otros mejores. Para entenderlo mejor la siguiente tabla muestra la equivalencia entre el sistema decimal y el binario.
Como ves, en el sistema decimal, las unidades van subiendo en potencias de 10 de 3 en 3, mientras que en el sistema binario son potencias de 2 que suben de 10 en 10.
En 1998, para evitar estas confusiones, la Comisión Electrotécnica Internacional (IEC) definió un sistema de prefijos binarios para evitar la confusión con el Sistema Internacional (SI) que se venía usando. Estos prefijos usan la sílaba bi
(de bit) para identificarlos. Fijate en la siguiente tabla:
Las unidades en el Sistema Internacional se abrevian como KB, MB, GB, etc. Mientras que en el sistema binario se agrega una i como KiB, MiB, GiB. Ten en cuenta que para abreviar bytes se usa la B mayúscula y para bits la b minúscula, así que MB no es lo mismo que Mb, ¿recuerdas el ejemplo de los proveedores de internet?
Si nos ponemos estrictos las unidades binarias son las correctas, pero en la práctica casi nadie las usa (más que en documentos científicos) y todo mundo entiende las internacionales, así que no te hasgas el especial corrigiendo al mundo que no se dice megabytes sino mebibytes. Ya tenemos a suficientes especiales corrigiendo que se dice biblioteca y no librería como para soportar a otros.
De las pelotas de tenis hasta Júpiter
Los datos no paran de crecer y desde hace muchos años son el nuevo petróleo. Primero porque las empresas usaban tus datos para espiarte y conocerte mejor que tú mismo para enviarte publicidad. Y ahora porque tus datos y los de todo el mundo se usan para entrenar modelos de Inteligencia Artificial.
Por cierto, si quieres saber que magia negra existe detrás del Machine Learning (el proceso que hace que las computadoras puedan aprender) mira este video.
Para cerrar este blog, y para que tengas una idea del gigante volumen de datos, imagina que un byte es una pelota de tenis. Entoces:
- 1 kilobyte es un refrigerador
- 1 megabyte es una piscina olimpica
- 1 gigabyte es un rascacielos
- 1 terabyte es una gran ciudad (como New York)
- 1 petabyte es un país mediano, como Colombia
- 1 zettabyte sería el doble del área total de la tierra, y
- 1 yottabyte sería Júpiter
Recuerda que estas comparaciones son aproximadas y no exactas, pero sirven para que te hagas una idea del tamaño de los datos. Ahora eres todo un experto en las unidades de almacenamiento de datos y cuando alguien te pregunte “¿Cómo sabes todo eso?” respóndeles que lo aprendiste en EDteam.
Y recuerda, en pocos días regresa el EDweekend 2023 a EDteam: un fin de semana lleno de descuentos y sorpresas. Regístrate en ed.team y obtén acceso anticipado a todas las promociones.
Mira el video completo en Youtube: