Se trata del big data, un término ya muy común en la industria tecnológica y en otros muchos ámbitos. Se define como una cantidad masiva de datos. Para que estos datos adquieran sentido (información de valor) deben analizarse, procesarse y manejarse con técnicas especializadas no convencionales.
Los datos que actualmente manejan las empresas se dividen en dos categorías: estructurados y no estructurados. Los primeros existen en un formato creado para ser capturado, almacenado, organizado y analizado. Por ello, los datos estructurados aportan ventajas inherentes cuando se trata de grandes volúmenes de información. Algunos ejemplos son las bases de datos, los algoritmos de búsqueda o las hojas de cálculo de un Excel.
Los datos no estructurados incluyen contenidos como vídeo, correo electrónico, imágenes, podcasts, publicaciones en redes sociales o archivos PDF. Estos datos no tienen un identificador interno que permita a las funciones de búsqueda reconocerlos. Se dice que este tipo de datos constituyen el 80% de los datos generados. Ambos tipos de datos pueden fusionarse y complementarse en forma de datos semiestructurados. Estos incluyen la posibilidad de añadir etiquetas, palabras clave y metadatos a datos no estructurados.
Los datos estructurados son importantes, pero los no estructurados proporcionan una riqueza de conocimientos no explicables por los números y las estadísticas. El problema: son más difíciles de analizar, lo que hace que muchas empresas no los tengan tanto en cuenta. La consecuencia es una pérdida importante de inteligencia empresarial (con cifras en mano, se estaría dejando de utilizar un 80% de información muy valiosa).
Por lo tanto, las organizaciones deben encontrar formas de gestionar y analizar estos datos para poder utilizarlos en la toma de decisiones empresariales. Esto les proporcionará una ventaja competitiva. Estos son algunos ejemplos de los conocimientos que pueden aportar los datos no estructurados:
Por su naturaleza cuantitativa, existen muchas herramientas disponibles para el manejo de fuentes de datos estructurados. Sin embargo, el análisis de datos no estructurados es una industria relativamente «nueva», aún está en desarrollo.
Los avances en las herramientas de inteligencia artificial, no obstante, permiten ahora que las máquinas clasifiquen todos los datos no estructurados de forma automática. Así se convierten en datos estructurados. Para estas técnicas se utiliza una combinación de aprendizaje automático y procesamiento del lenguaje natural (PLN). Veamos algunos ejemplos:
Gracias a estas herramientas pueden procesarse grandes cantidades de datos en cuestión de segundos. Con ello, se eliminan tareas repetitivas que antes debían hacerse manualmente. Así, las empresas ahorran tiempo, recursos y dinero.
El uso eficiente de datos no estructurados abre puertas que conducirán a una gran cantidad de información sin explotar. Aunque queda mucho por recorrer, reconocer su valor y emplear las herramientas adecuadas puede aportar una gran ventaja competitiva y ahorrar muchas horas de trabajo manual.
– What is Unstructured Data? TIBCO. Acceso en: https://www.tibco.com/reference-center/what-is-unstructured-data
– Dan Muse, What is Unstructured Data?, Datamation. Acceso en: https://www.datamation.com/big-data/structured-data
– ¿Qué es el big data? Oracle. Acceso en: https://www.oracle.com/es/big-data/what-is-big-data
– Los datos abiertos, un elemento transformador, datos.gob.es. Acceso en: https://datos.gob.es/gl/noticia/los-datos-abiertos-un-elemento-transformador