Conceptos basicos de big data

Inicio » Conceptos basicos de big data

Uso de los grandes datos

Las personas y las máquinas generan cantidades inimaginables de datos: actualmente 16,3 zettabytes al año, una cifra que se multiplicará por diez de aquí a 2025. Los «big data» son un recurso muy valioso que está cambiando nuestra forma de comunicarnos: Divulgamos cada vez más información sobre nosotros mismos. Esta tendencia tiene ventajas y desventajas.

Durante la pausa para comer, sacas tu smartphone y consultas varias aplicaciones para ver qué te has perdido. Pides algo en una tienda online en un momento dado, porque acabas de recibir un mensaje push que te dice que el precio del casco de esquí que te interesa ha sido fuertemente rebajado. Lo que parece una coincidencia es, en realidad, el producto de las matemáticas avanzadas, la capacidad de análisis y el marketing dirigido, es decir, de los big data aplicados.

En todo el mundo, las personas y las máquinas producen enormes cantidades de datos las 24 horas del día: en los navegadores de Internet y las redes sociales, mientras conducen, cuando pagan con tarjeta de crédito, durante las compras en línea, mientras hacen llamadas con sus teléfonos inteligentes, y mucho más.

Qué es el big data

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software tradicional de procesamiento de datos no puede gestionarlos. Pero estos volúmenes masivos de datos pueden utilizarse para resolver problemas de negocio que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Conceptos básicos de big data pdf

El volumen de datos que hay que tratar se ha disparado hasta niveles inimaginables en la última década y, al mismo tiempo, el precio del almacenamiento de datos se ha reducido sistemáticamente. Las empresas privadas y las instituciones de investigación capturan terabytes de datos sobre las interacciones de sus usuarios, los negocios, las redes sociales y también los sensores de dispositivos como los teléfonos móviles y los automóviles. El reto de esta época es dar sentido a este mar de datos. Aquí es donde entra en escena la analítica de big data.

La analítica de grandes datos implica en gran medida la recopilación de datos de diferentes fuentes, la combinación de los mismos de manera que estén disponibles para ser consumidos por los analistas y, finalmente, ofrecer productos de datos útiles para el negocio de la organización.

Este tutorial ha sido preparado para los profesionales del software que aspiran a aprender los fundamentos de Big Data Analytics. Los profesionales que se dedican a la analítica en general también pueden utilizar este tutorial con buenos resultados.

Ejemplo de análisis de big data

La analítica de big data es el uso de técnicas analíticas avanzadas contra conjuntos de big data muy grandes y diversos que incluyen datos estructurados, semiestructurados y no estructurados, de diferentes fuentes y en diferentes tamaños, desde terabytes hasta zettabytes.

¿Qué son exactamente los big data? Puede definirse como conjuntos de datos cuyo tamaño o tipo supera la capacidad de las bases de datos relacionales tradicionales para capturar, gestionar y procesar los datos con baja latencia. Las características de los big data incluyen un alto volumen, una alta velocidad y una gran variedad. Las fuentes de datos se están volviendo más complejas que las de los datos tradicionales porque están siendo impulsadas por la inteligencia artificial (IA), los dispositivos móviles, los medios sociales y el Internet de las cosas (IoT). Por ejemplo, los diferentes tipos de datos proceden de sensores, dispositivos, vídeo/audio, redes, archivos de registro, aplicaciones transaccionales, web y medios sociales, muchos de ellos generados en tiempo real y a muy gran escala.

Con la analítica de big data, puede impulsar una toma de decisiones mejor y más rápida, la modelización y predicción de resultados futuros y la mejora de la inteligencia empresarial. A la hora de crear su solución de big data, considere el software de código abierto como Apache Hadoop, Apache Spark y todo el ecosistema Hadoop como herramientas de procesamiento y almacenamiento de datos rentables y flexibles, diseñadas para manejar el volumen de datos que se genera hoy en día.

Scroll al inicio
Ir arriba