Big data introducción al uso práctico de datos masivos

Inicio » Big data introducción al uso práctico de datos masivos

Ejemplos de big data

El uso actual del término big data tiende a referirse al uso de la analítica predictiva, la analítica del comportamiento del usuario o algunos otros métodos avanzados de análisis de datos que extraen valor de los big data, y rara vez a un tamaño concreto del conjunto de datos. «Hay pocas dudas de que las cantidades de datos disponibles ahora son realmente grandes, pero esa no es la característica más relevante de este nuevo ecosistema de datos»[4].

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [8][9] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[10] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[11] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[12]. Una cuestión que se plantea a las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[13].

Panorama de los grandes datos

Hoy en día, casi 6.500 millones de dispositivos conectados comparten información a través de Internet. En 2025, esta cifra ascenderá a 20.000 millones. El big data analiza este «mar de datos» para convertirlo en la información que está transformando nuestro mundo.

La revolución digital está cambiando la economía, la sociedad y las personas. Los datos generados por miles de millones de dispositivos están en el centro de esta revolución. Según Gartner, en 2016 había cerca de 6.500 millones de dispositivos y esta cifra aumentará a 20.000 millones en 2025. Asimismo, según un importante proveedor de soluciones TIC, el Internet de las Cosas supondrá un fuerte aumento, con hasta 100.000 millones de dispositivos conectados.

El big data es el conjunto de tecnologías creadas para almacenar, analizar y gestionar este volumen de datos, una macroherramienta creada para identificar patrones en el caos de esta explosión de información con el fin de diseñar soluciones inteligentes. Hoy se utiliza en ámbitos tan diversos como la medicina, la agricultura, el juego o la protección del medio ambiente.

Casi un sinfín de aplicaciones: Los sistemas de GPS pueden detectar atascos en la zona que consulta un usuario y sugerirle alternativas; un canal de televisión por streaming de suscripción ha creado los personajes y la trama de sus series más exitosas analizando los contenidos que consumen y prefieren ver sus espectadores; los relojes inteligentes monitorizan el ritmo cardíaco de millones de usuarios e identifican patrones que pueden anticiparse y prevenir enfermedades cardiovasculares; los sensores de humedad en los campos de cultivo planifican la frecuencia de riego, combinando sus datos con las previsiones meteorológicas, y un largo etcétera. Sus aplicaciones han llegado incluso al mundo de la política: Juan Verde, el asesor español que ha trabajado en las campañas políticas del partido demócrata en EE.UU. afirmó que: «Ya no son las elecciones de la televisión; son las elecciones del big data».

Introducción al análisis de big data pdf

Big Data es hoy en día la palabra de moda, y con la cantidad de datos que generan cada minuto los consumidores y/o las empresas de todo el mundo, se puede encontrar un enorme valor en el análisis de Big Data.

El análisis de Big Data es un proceso utilizado para extraer información significativa, como patrones ocultos, correlaciones desconocidas, tendencias de mercado y preferencias de los clientes. La analítica de Big Data ofrece varias ventajas: puede utilizarse para mejorar la toma de decisiones y prevenir actividades fraudulentas, entre otras cosas.

Tomemos como ejemplo la plataforma de streaming de música Spotify.  La empresa tiene casi 96 millones de usuarios que generan una enorme cantidad de datos cada día. A través de esta información, la plataforma basada en la nube genera automáticamente sugerencias de canciones -a través de un motor de recomendación inteligente- basadas en los «me gusta», los «compartidos», el historial de búsqueda, etc. Lo que permite esto son las técnicas, herramientas y marcos de trabajo que son el resultado de la analítica de Big Data.

Si eres usuario de Spotify, seguro que te has topado con la sección de recomendaciones principales, que se basa en tus gustos, tu historial y otras cosas. Utilizar un motor de recomendación que aprovecha las herramientas de filtrado de datos que recogen datos y luego los filtran mediante algoritmos funciona. Esto es lo que hace Spotify.

Introducción al análisis de big data ppt

El término big data hace referencia a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las «tres v» del big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.

Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.

Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.

Scroll al inicio
Ir arriba