Transformación digital: la importancia de los datos abiertos

El flujo de datos abiertos debería estar en el centro de la estrategia de transformación digital de cualquier empresa. El éxito actual depende cada vez más de la capacidad para recopilar, analizar, procesar y actuar sobre estos datos. El uso y la comunicación de datos abiertos están entre las principales recomendaciones para acelerar la digitalización en España.

Se trata del big data, un término ya muy común en la industria tecnológica y en otros muchos ámbitos. Se define como una cantidad masiva de datos. Para que estos datos adquieran sentido (información de valor) deben analizarse, procesarse y manejarse con técnicas especializadas no convencionales.

Tipos de fuentes de datos

Los datos que actualmente manejan las empresas se dividen en dos categorías: estructurados y no estructurados. Los primeros existen en un formato creado para ser capturado, almacenado, organizado y analizado. Por ello, los datos estructurados aportan ventajas inherentes cuando se trata de grandes volúmenes de información. Algunos ejemplos son las bases de datos, los algoritmos de búsqueda o las hojas de cálculo de un Excel.

Los datos no estructurados incluyen contenidos como vídeo, correo electrónico, imágenes, podcasts, publicaciones en redes sociales o archivos PDF. Estos datos no tienen un identificador interno que permita a las funciones de búsqueda reconocerlos. Se dice que este tipo de datos constituyen el 80% de los datos generados. Ambos tipos de datos pueden fusionarse y complementarse en forma de datos semiestructurados. Estos incluyen la posibilidad de añadir etiquetas, palabras clave y metadatos a datos no estructurados.

Obtener información de valor

Los datos estructurados son importantes, pero los no estructurados proporcionan una riqueza de conocimientos no explicables por los números y las estadísticas. El problema: son más difíciles de analizar, lo que hace que muchas empresas no los tengan tanto en cuenta. La consecuencia es una pérdida importante de inteligencia empresarial (con cifras en mano, se estaría dejando de utilizar un 80% de información muy valiosa).

Por lo tanto, las organizaciones deben encontrar formas de gestionar y analizar estos datos para poder utilizarlos en la toma de decisiones empresariales. Esto les proporcionará una ventaja competitiva. Estos son algunos ejemplos de los conocimientos que pueden aportar los datos no estructurados:

– Experiencia y sentimiento del cliente: puede extraerse información muy valiosa de llamadas telefónicas, chats de atención al cliente, comentarios en las redes sociales o correos electrónicos.

– Desarrollo de productos y mantenimiento predictivo de los mismos.

– Eficiencia operativa.

– Inteligencia de marketing: los datos pueden ser una mina de oro de inteligencia de marketing. Hay un montón de información esperando a ser descubierta que indica a las empresas los patrones de comportamiento de los clientes y qué tipos de ofertas de productos o servicios son los más atractivos.

– Oportunidades de I+D e innovación: noticias, blogs, publicaciones y comentarios en las redes sociales, y reseñas en línea de los competidores, entre otras fuentes de información, son un tesoro de información sobre las tendencias del sector y del mercado.

Manejo de fuentes de datos

Por su naturaleza cuantitativa, existen muchas herramientas disponibles para el manejo de fuentes de datos estructurados. Sin embargo, el análisis de datos no estructurados es una industria relativamente «nueva», aún está en desarrollo.

Los avances en las herramientas de inteligencia artificial, no obstante, permiten ahora que las máquinas clasifiquen todos los datos no estructurados de forma automática. Así se convierten en datos estructurados. Para estas técnicas se utiliza una combinación de aprendizaje automático y procesamiento del lenguaje natural (PLN). Veamos algunos ejemplos:

– Con los algoritmos de inteligencia artificial (IA) pueden extraerse palabras clave, números de teléfono, nombres, sentimientos de los clientes y otros datos clave, estructurarlos y devolverlos al sistema interno de la empresa.

– El procesamiento inteligente de documentos permite clasificar diversos tipos de documentos no estructurados y variaciones de datos, almacenarlos en la categoría y el formato correctos y recuperarlos para la toma de decisiones.

Web scraping: es una técnica que sirve para extraer información de páginas web de forma automatizada. Con este método, cada vez más importante, se “leen” textos de páginas web para obtener información y almacenarla.

Gracias a estas herramientas pueden procesarse grandes cantidades de datos en cuestión de segundos. Con ello, se eliminan tareas repetitivas que antes debían hacerse manualmente. Así, las empresas ahorran tiempo, recursos y dinero.

Claves para el éxito en la transformación digital

– La nube es el elemento central de cualquier programa de inteligencia de datos. Es imposible no mirar a la nube como medio de almacenamiento y análisis de datos. Un ejemplo de ello es el Open Science Cloud, creado desde las instituciones públicas para que investigadores de toda Europa puedan almacenar y compartir datos entre países.

– Nuevas formas de trabajo: los responsables de datos y análisis deben priorizar las cargas de trabajo para explotar del todo las nuevas capacidades que aportan los datos. Asimismo, la optimización de costes debe ser un punto central en todo el proceso de transformación digital.

– Nuevos modelos de negocio: los datos no deben ser estáticos y deben utilizarse para fines estratégicos. Asimismo, para que sean útiles en términos estratégicos deben fluir libremente.

– Alinear datos estructurados y no estructurados: los datos aislados no aportan valor. Puede lograrse una verdadera perspectiva empresarial con la fusión de todos los datos a los que se tiene acceso.

Barreras y retos de la transformación digital

– El volumen de datos duplica su tamaño cada 2 años más o menos. Es un reto mantener este ritmo de crecimiento y encontrar formas de almacenarlos eficazmente.

– Privacidad de los datos y cuestiones legales.

– Accesibilidad y calidad: disponer de datos de verdad relevantes para el cliente y organizados para que tengan sentido requiere mucho trabajo. Los responsables dedican entre un 50 % y un 80 % de su tiempo a seleccionar y preparar los datos antes de que estos puedan utilizarse. Si no se hace una buena planificación, costará mucho obtener los datos que se esperan y aumentarán los gastos previstos.

– Muchas de las empresas aún tratan las iniciativas de big data como proyectos tradicionales, es decir, utilizando tecnologías que permiten hacer un tratamiento convencional de estos datos y que no permiten extraer todo el potencial de la información obtenida.

– Mantenerse al día en cuanto a este tipo de tecnología supone un desafío constante.

El uso eficiente de datos no estructurados abre puertas que conducirán a una gran cantidad de información sin explotar. Aunque queda mucho por recorrer, reconocer su valor y emplear las herramientas adecuadas puede aportar una gran ventaja competitiva y ahorrar muchas horas de trabajo manual.

Fuentes

– What is Unstructured Data? TIBCO. Acceso en: https://www.tibco.com/reference-center/what-is-unstructured-data

– Dan Muse, What is Unstructured Data?, Datamation. Acceso en: https://www.datamation.com/big-data/structured-data

– ¿Qué es el big data? Oracle. Acceso en: https://www.oracle.com/es/big-data/what-is-big-data

– Los datos abiertos, un elemento transformador, datos.gob.es. Acceso en: https://datos.gob.es/gl/noticia/los-datos-abiertos-un-elemento-transformador