¿qué es trabajar de big data?

Inicio » ¿qué es trabajar de big data?

Qué es la analítica de big data

El uso actual del término big data tiende a referirse al uso de la analítica predictiva, la analítica del comportamiento del usuario o algunos otros métodos avanzados de análisis de datos que extraen valor de los big data, y rara vez a un tamaño concreto del conjunto de datos. “Hay pocas dudas de que las cantidades de datos disponibles ahora son realmente grandes, pero esa no es la característica más relevante de este nuevo ecosistema de datos”[4].

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [9][10] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[11] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[12] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[13]. Una cuestión que se plantea a las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[14].

Fuentes de big data

Las plataformas de big data están especialmente diseñadas para manejar volúmenes insondables de datos que entran en el sistema a gran velocidad y con gran variedad. Estas plataformas de big data suelen consistir en diversos servidores, bases de datos y herramientas de inteligencia empresarial que permiten a los científicos de datos manipular los datos para encontrar tendencias y patrones.

Para comprender la enormidad de la diferencia de escala, considere esta comparación de la Escuela de Información de Berkeley: un gigabyte es el equivalente a un vídeo de siete minutos en HD, mientras que un solo zettabyte equivale a 250.000 millones de DVD.

Las empresas y organizaciones deben tener la capacidad de aprovechar estos datos y generar ideas a partir de ellos en tiempo real, de lo contrario no son muy útiles. El procesamiento en tiempo real permite a los responsables de la toma de decisiones actuar con rapidez, lo que les da una ventaja sobre la competencia.

Mientras que algunas formas de datos pueden procesarse por lotes y seguir siendo relevantes a lo largo del tiempo, gran parte de los big data llegan a las organizaciones a toda velocidad y requieren una acción inmediata para obtener los mejores resultados. Los datos de los sensores de los dispositivos sanitarios son un buen ejemplo. La capacidad de procesar instantáneamente los datos sanitarios puede proporcionar a los usuarios y a los médicos información que podría salvarles la vida.

Pros y contras de los big data

El uso actual del término big data tiende a referirse al uso de la analítica predictiva, la analítica del comportamiento del usuario o algunos otros métodos avanzados de análisis de datos que extraen valor de los big data, y rara vez a un tamaño concreto del conjunto de datos. “Hay pocas dudas de que las cantidades de datos disponibles ahora son realmente grandes, pero esa no es la característica más relevante de este nuevo ecosistema de datos”[4].

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [9][10] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[11] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[12] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[13]. Una cuestión que se plantea a las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[14].

Uso de big data

El uso actual del término big data tiende a referirse al uso de la analítica predictiva, la analítica del comportamiento del usuario o algunos otros métodos avanzados de análisis de datos que extraen valor de los big data, y rara vez a un tamaño concreto del conjunto de datos. “Hay pocas dudas de que las cantidades de datos disponibles ahora son realmente grandes, pero esa no es la característica más relevante de este nuevo ecosistema de datos”[4].

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [9][10] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[11] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[12] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[13]. Una cuestión que se plantea a las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[14].

Ir arriba