Para los entendidos en la materia hablar de Big Data o Macro Datos es hablar de conjuntos de datos extremadamente grandes, dichos conjuntos contienen grandes cantidades de información sobre hechos ocurridos en el pasado, el presente y en consecuencia, llegar a predecir el futuro, de modo de aportar valor al negocio, reducir costos y aumentar la eficiencia ayudando a tomar buenas y mejores decisiones a las organizaciones.
Si bien, en términos de cantidad de datos, no existe un numero de filas o registros que determine en que momento se comienza a hablar de BIGDATA, existe una definición que me gusta mucho del año 2016 que establece que, “los “macro datos” representan los activos de información caracterizados por un volumen, velocidad y variedad tan altos que requieren una tecnología específica y métodos analíticos para su transformación en valor“.
De lo anterior, ya se observan las 3v del Big Data:
Volumen
El volumen se refiere a la cantidad de datos que se generan y recopilan constantemente. Los macro datos en las organizaciones no solo se componen de datos internos creados por la organización, sino que a menudo requieren datos externos, procedentes, por ejemplo, de las redes sociales o de las interacciones con los clientes.
Velocidad
Los datos se generan continuamente, y las plataformas de big data deben ser capaces de acceder a ellos, almacenarlos y procesarlos para que las organizaciones puedan tomar mejores decisiones basadas en la información. Por tanto, la velocidad se refiere a la rapidez con la que se crean, acceden, almacenan y procesan los datos.
Variedad
Los datos son muy diversos, por lo que no todos pueden procesarse de la misma manera. Los datos no son homogéneos, ya que proceden de orígenes o fuentes diferentes, son de tipos distintos y tienen formatos diferentes.
En el tenor de lo expuesto, los macro datos son conjuntos de datos demasiado grandes y complejos, que las herramientas tradicionales de almacenamiento y procesamiento no pueden manejar, por tanto se requiere de la ayuda de plataformas de almacenamiento de datos y arquitecturas de gestión de datos apropiadas.
Para concluir, los macro datos son esenciales para ganar agilidad en la toma de decisiones, anticipar y resolver problemas que antes no se podían abordar, mejorando la gestión empresarial y aumentando los beneficios de las organizaciones.
Este articulo es una pincelada de lo que es el big data. En otro articulo intentare detallarlo un poco mas, sobre todo con temas que me interesan mucho, como las diferencias entre Data Lake y Data Warehouse, temas ligados totalmente al Big Data