¿qué significa el big data?

Inicio » ¿qué significa el big data?

¿qué significa el big data?

Ejemplos de big data

Reimpresión: R1210C Los autores escriben que los big data son mucho más potentes que la analítica del pasado. Los directivos pueden medir y, por tanto, gestionar con más precisión que nunca. Pueden hacer mejores predicciones y tomar decisiones más inteligentes. Pueden dirigir intervenciones más eficaces en áreas que hasta ahora han estado dominadas por el instinto y la intuición en lugar de por los datos y el rigor. Las diferencias entre el big data y la analítica son una cuestión de volumen, velocidad y variedad: Ahora cruzan por Internet más datos cada segundo que los que se almacenaban en todo Internet hace 20 años. La información casi en tiempo real permite a una empresa ser mucho más ágil que sus competidores. Y esa información puede proceder de redes sociales, imágenes, sensores, la web u otras fuentes no estructuradas. Sin embargo, los retos de gestión son muy reales. Los responsables de la toma de decisiones de alto nivel tienen que aprender a hacer las preguntas correctas y adoptar una toma de decisiones basada en pruebas. Las organizaciones deben contratar a científicos que puedan encontrar patrones en conjuntos de datos muy grandes y traducirlos en información empresarial útil. Los departamentos de TI tienen que trabajar duro para integrar todas las fuentes de datos internas y externas relevantes. Los autores ofrecen dos casos de éxito para ilustrar cómo las empresas están utilizando el big data: PASSUR Aerospace permite a las aerolíneas comparar sus tiempos de llegada reales con los estimados. Sears Holdings analiza directamente los datos de sus tiendas para hacer promociones mucho más precisas y rápidas.

Qué es el análisis de big data

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software tradicional de procesamiento de datos no puede gestionarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Aplicaciones de big data

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [8][9] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[10] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[11] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[12]. Una cuestión para las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[13].

Los sistemas de gestión de bases de datos relacionales y los paquetes de software estadístico de escritorio utilizados para visualizar los datos suelen tener dificultades para procesar y analizar los big data. El procesamiento y análisis de big data puede requerir «software masivamente paralelo que se ejecuta en decenas, cientos o incluso miles de servidores»[14] Lo que se califica como «big data» varía en función de las capacidades de quienes lo analizan y de sus herramientas. Además, la ampliación de las capacidades hace de los big data un objetivo móvil. «Para algunas organizaciones, enfrentarse a cientos de gigabytes de datos por primera vez puede provocar la necesidad de reconsiderar las opciones de gestión de datos. Para otras, pueden ser necesarias decenas o cientos de terabytes antes de que el tamaño de los datos se convierta en una consideración significativa»[15].

Cómo funciona el big data

¿Qué es el big data? Esa es una buena pregunta. Parece que hay tantas definiciones de big data como empresas, organizaciones sin ánimo de lucro, agencias gubernamentales y personas que quieren beneficiarse de ellos.

Una interpretación popular de big data se refiere a conjuntos de datos extremadamente grandes. Un informe del Instituto Nacional de Estándares y Tecnología definió los big data como «conjuntos de datos extensos -principalmente en las características de volumen, velocidad y/o variabilidad- que requieren una arquitectura escalable para un almacenamiento, manipulación y análisis eficientes». Algunos han definido los big data como una cantidad de datos que supera un petabyte -un millón de gigabytes-.

Estos datos proceden de innumerables fuentes: teléfonos inteligentes y publicaciones en las redes sociales; sensores, como semáforos y contadores de servicios públicos; terminales de puntos de venta; dispositivos portátiles de los consumidores, como los medidores de peso; historiales médicos electrónicos; y un largo etcétera.

En las profundidades de estos datos hay inmensas oportunidades para las organizaciones que tienen el talento y la tecnología para transformar sus vastos almacenes de datos en una visión procesable, una mejor toma de decisiones y una ventaja competitiva.

Scroll al inicio
Ir arriba