¿Qué puede hacer el Big Data?

Inicio » ¿Qué puede hacer el Big Data?

Pros y contras de los big data

La analítica de big data es el uso de técnicas analíticas avanzadas contra conjuntos de big data muy grandes y diversos que incluyen datos estructurados, semiestructurados y no estructurados, de diferentes fuentes y en diferentes tamaños, desde terabytes hasta zettabytes.

¿Qué son exactamente los big data? Puede definirse como conjuntos de datos cuyo tamaño o tipo supera la capacidad de las bases de datos relacionales tradicionales para capturar, gestionar y procesar los datos con baja latencia. Las características de los big data incluyen un alto volumen, una alta velocidad y una gran variedad. Las fuentes de datos se están volviendo más complejas que las de los datos tradicionales porque están siendo impulsadas por la inteligencia artificial (IA), los dispositivos móviles, los medios sociales y el Internet de las cosas (IoT). Por ejemplo, los diferentes tipos de datos proceden de sensores, dispositivos, vídeo/audio, redes, archivos de registro, aplicaciones transaccionales, web y medios sociales, muchos de ellos generados en tiempo real y a muy gran escala.

Con la analítica de big data, puede impulsar una toma de decisiones mejor y más rápida, la modelización y predicción de resultados futuros y la mejora de la inteligencia empresarial. A la hora de crear su solución de big data, considere el software de código abierto como Apache Hadoop, Apache Spark y todo el ecosistema Hadoop como herramientas de procesamiento y almacenamiento de datos rentables y flexibles, diseñadas para manejar el volumen de datos que se genera hoy en día.

Análisis de big data

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos tradicional no puede gestionarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Valor de los grandes datos

Big data se refiere a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las «tres v» del big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.

Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.

Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.

Qué es el big data

Hoy en día, casi 6.500 millones de dispositivos conectados comparten información a través de Internet. En 2025, esta cifra ascenderá a 20.000 millones. El big data analiza este «mar de datos» para convertirlo en la información que está transformando nuestro mundo.

La revolución digital está cambiando la economía, la sociedad y las personas. Los datos generados por miles de millones de dispositivos están en el centro de esta revolución. Según Gartner, en 2016 había cerca de 6.500 millones de dispositivos y esta cifra aumentará a 20.000 millones en 2025. Asimismo, según un importante proveedor de soluciones TIC, el Internet de las Cosas supondrá un fuerte aumento, con hasta 100.000 millones de dispositivos conectados.

El big data es el conjunto de tecnologías creadas para almacenar, analizar y gestionar este volumen de datos, una macroherramienta creada para identificar patrones en el caos de esta explosión de información con el fin de diseñar soluciones inteligentes. Hoy se utiliza en ámbitos tan diversos como la medicina, la agricultura, el juego o la protección del medio ambiente.

Un número casi infinito de aplicaciones: Los sistemas de GPS pueden detectar atascos en la zona que consulta un usuario y sugerirle alternativas; un canal de televisión por streaming de suscripción ha creado los personajes y la trama de sus series más exitosas analizando los contenidos que consumen y prefieren ver sus espectadores; los relojes inteligentes monitorizan el ritmo cardíaco de millones de usuarios e identifican patrones que pueden anticiparse y prevenir enfermedades cardiovasculares; los sensores de humedad en los campos de cultivo planifican la frecuencia de riego, combinando sus datos con las previsiones meteorológicas, y un largo etcétera. Sus aplicaciones han llegado incluso al mundo de la política: Juan Verde, el asesor español que ha trabajado en las campañas políticas del partido demócrata en EE.UU. afirmó que: «Ya no son las elecciones de la televisión; son las elecciones del big data».

Scroll al inicio
Ir arriba