Dificultades relacionadas con los macrodatos o big data

Inicio » Dificultades relacionadas con los macrodatos o big data

Problemas con el big data

El propósito de este documento de posición es presentar el estado actual, las oportunidades y los desafíos del big data y la IA en la educación. El trabajo se ha originado a partir de las opiniones y las actas de los paneles de discusión de una conferencia internacional sobre big data e IA en la educación (The International Learning Sciences Forum, 2019), donde destacados investigadores y expertos de diferentes disciplinas como la educación, la psicología, la ciencia de los datos, la IA y la neurociencia cognitiva, etc., intercambiaron sus conocimientos e ideas. Este artículo está organizado de la siguiente manera: comenzamos con una visión general del progreso reciente de los grandes datos y la IA en la educación. A continuación, presentamos los principales retos y las tendencias emergentes. Por último, basándonos en nuestras discusiones sobre los grandes datos y la IA en la educación, se sugieren las conclusiones y el alcance futuro.

Como subconjunto de la IA, el aprendizaje automático se centra en la construcción de sistemas informáticos que pueden aprender de los datos y adaptarse a ellos automáticamente sin necesidad de programación explícita (Jordan y Mitchell, 2015). Los algoritmos de aprendizaje automático pueden proporcionar nuevos conocimientos, predicciones y soluciones para personalizar las necesidades y circunstancias de cada individuo. Con la disponibilidad de una gran cantidad de datos de entrenamiento de entrada de alta calidad, los procesos de aprendizaje automático pueden lograr resultados precisos y facilitar la toma de decisiones informadas (Manyika et al., 2011; Gobert et al., 2012, 2013; Gobert y Sao Pedro, 2017). Estos métodos de aprendizaje automático con gran cantidad de datos se sitúan en la intersección de los big data y la IA, y son capaces de mejorar los servicios y la productividad de la educación, así como de muchos otros campos, como el comercio, la ciencia y la administración.

Beneficios y retos del big data

El big data es el próximo gran campo de oportunidades para las empresas. La información obtenida a partir del big data puede ayudar a mejorar la experiencia del cliente, a identificar y resolver problemas dentro de la organización, a proporcionar una visión del ciclo de vida del cliente y a informar sobre formas de aumentar las ventas, entre otros muchos beneficios.

Por no hablar de que la cantidad de datos que se generan cada día no deja de crecer; de hecho, la producción de datos será 44 veces mayor en 2020 que en 2009. Como resultado, las empresas tienen más datos que nunca a su disposición para fundamentar sus decisiones comerciales.

Sin embargo, esta gran cantidad de datos conlleva muchos retos, como por ejemplo, ¿por dónde empezar? Para que sean útiles, los big data deben ser rastreados, gestionados, protegidos y enriquecidos a lo largo de todo su recorrido dentro de la organización para obtener los resultados más eficaces.

El primer problema con el que se encuentran muchas empresas es que los big data son, bueno, grandes. Parece que hay datos para todo: los intereses de los clientes, los visitantes del sitio web, las tasas de conversión, las tasas de abandono, los datos financieros y mucho más.

Por qué es importante el big data

Sin embargo, el big data también causa muchos problemas. Las empresas necesitan utilizar los métodos de integración de datos adecuados para extraer, transferir, almacenar y analizar todos estos datos estructurados y no estructurados.  De lo contrario, todos estos datos son inútiles.

El problema es que algunas herramientas de integración de big data no están diseñadas para el cumplimiento. Los algoritmos de datos y las prácticas estadísticas no siempre tienen en cuenta la legislación pertinente y los marcos de seguridad que protegen los datos sensibles.

Los datos de baja calidad e inexactos son un gran obstáculo para las empresas de todos los tamaños. En la mayoría de los casos, las empresas no obtienen ningún valor de estos datos. Es una pérdida de tiempo y recursos. Los datos con un formato incoherente, por ejemplo, son difíciles de utilizar con fines estadísticos. Los datos duplicados, por otra parte, confunden a los equipos de ventas, marketing y atención al cliente.

A veces, los datos se vuelven de baja calidad durante la etapa de ETL, en la que las empresas extraen, transfieren y cargan datos de un sistema a otro. Los datos se “estropean” y dejan de aportar valor. Invertir en una herramienta de integración de datos de buena calidad evita que esto ocurra.

Qué es el big data

Ninguna organización puede funcionar sin datos hoy en día. Con las enormes cantidades de datos que se generan cada segundo a partir de las transacciones comerciales, las cifras de ventas, los registros de clientes y las partes interesadas, los datos son el combustible que impulsa a las empresas. Todos estos datos se amontonan en un enorme conjunto de datos que se denomina Big Data.

Estos datos deben ser analizados para mejorar la toma de decisiones. Sin embargo, las empresas se enfrentan a algunos retos relacionados con el Big Data. Entre ellos están la calidad de los datos, el almacenamiento, la falta de profesionales de la ciencia de los datos, la validación de los datos y la acumulación de datos de diferentes fuentes.

Las empresas fracasan en sus iniciativas de Big Data debido a una comprensión insuficiente. Los empleados pueden no saber qué son los datos, su almacenamiento, su procesamiento, su importancia y sus fuentes. Los profesionales de los datos pueden saber lo que ocurre, pero los demás pueden no tener una imagen clara.

Por ejemplo, si los empleados no entienden la importancia del almacenamiento de datos, podrían no guardar la copia de seguridad de los datos sensibles. Puede que no utilicen correctamente las bases de datos para su almacenamiento. Como resultado, cuando se necesitan estos datos importantes, no se pueden recuperar fácilmente.

Ir arriba