¿qué tipo de big data existen?

Inicio » ¿qué tipo de big data existen?

¿qué tipo de big data existen?

cómo funciona el big data

En el artículo de hoy, centraremos toda nuestra atención en algunas de las estadísticas de big data más alucinantes. Para quien no conozca el concepto de big data, TechJury ha preparado una breve introducción sobre el tema.

Big data se refiere a enormes conjuntos de datos recogidos de numerosas fuentes. Estos conjuntos de datos no pueden ser recogidos, almacenados o procesados con ninguna de las herramientas convencionales existentes debido a su cantidad y complejidad.

Por lo tanto, hay una variedad de herramientas que se utilizan para analizar los grandes datos: bases de datos NoSQL, Hadoop y Spark, por nombrar algunas. Con la ayuda de las herramientas de análisis de big data, podemos recopilar diferentes tipos de datos de las fuentes más versátiles: medios digitales, servicios web, aplicaciones empresariales, datos de registro de máquinas, etc.

Antes de que la analítica de Big Data se convirtiera en una idea totalmente desarrollada, las empresas almacenaban toneladas de información en sus bases de datos, sin saber qué hacer con ellas. Según las estadísticas mundiales sobre las tecnologías de Big Data, la mala calidad de los datos cuesta a las empresas de todo el mundo una media de entre 9,7 y 14,2 millones de dólares al año. En el caso de países como Estados Unidos, que operan en una economía muy orientada a los datos, esa cifra podría ascender a billones.

tecnologías de big data

El término «Big Data» es un poco equívoco, ya que implica que los datos preexistentes son de alguna manera pequeños (no lo son) o que el único reto es su gran tamaño (el tamaño es uno de ellos, pero a menudo hay más).

Hoy en día, las organizaciones se enfrentan cada vez más a retos de Big Data. Tienen acceso a una gran cantidad de información, pero no saben cómo obtener valor de ella porque se encuentra en su forma más cruda o en un formato semiestructurado o no estructurado; y como resultado, ni siquiera saben si vale la pena conservarla (o incluso si pueden conservarla).

Una encuesta de IBM reveló que más de la mitad de los líderes empresariales de hoy en día se dan cuenta de que no tienen acceso a la información que necesitan para hacer su trabajo. Las empresas se enfrentan a estos desafíos en un clima en el que tienen la capacidad de almacenar cualquier cosa y están generando datos como nunca antes en la historia; combinados, esto presenta un verdadero desafío de información.

Es un enigma: las empresas de hoy tienen más acceso que nunca a la información potencial, pero a medida que esta mina de oro potencial de datos se acumula, el porcentaje de datos que la empresa puede procesar está disminuyendo rápidamente. Sencillamente, la era del Big Data está en pleno apogeo porque el mundo está cambiando.

qué es el big data

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [8][9] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[10] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[11] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[12]. Una cuestión para las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[13].

Los sistemas de gestión de bases de datos relacionales y los paquetes de software estadístico de escritorio utilizados para visualizar los datos suelen tener dificultades para procesar y analizar los big data. El procesamiento y análisis de big data puede requerir «software masivamente paralelo que se ejecuta en decenas, cientos o incluso miles de servidores»[14] Lo que se califica como «big data» varía en función de las capacidades de quienes lo analizan y de sus herramientas. Además, la ampliación de las capacidades hace de los big data un objetivo móvil. «Para algunas organizaciones, enfrentarse a cientos de gigabytes de datos por primera vez puede provocar la necesidad de reconsiderar las opciones de gestión de datos. Para otras, pueden ser necesarias decenas o cientos de terabytes antes de que el tamaño de los datos se convierta en una consideración significativa»[15].

ejemplos de big data

El Big Data está creando una revolución en el campo de las TI, cada año el uso de la analítica aumenta drásticamente. Estamos creando 2,5 quintillones de bytes de datos cada día, de ahí que el campo se esté expandiendo en las aplicaciones B2C. El Big Data ha entrado en casi todas las industrias hoy en día y es una fuerza impulsora dominante detrás del éxito de las empresas y organizaciones en todo el mundo.

Los datos estructurados se utilizan para referirse a los datos que ya están almacenados en bases de datos, de forma ordenada. Representan alrededor del 20% del total de los datos existentes y son los más utilizados en la programación y las actividades relacionadas con la informática.

Hay dos fuentes de datos estructurados: las máquinas y los humanos. Todos los datos recibidos de sensores, weblogs y sistemas financieros se clasifican dentro de los datos generados por máquinas. Entre ellos se encuentran los dispositivos médicos, los datos del GPS, los datos de las estadísticas de uso captadas por los servidores y las aplicaciones y la enorme cantidad de datos que suelen circular por las plataformas de negociación, por citar algunos.

Los datos estructurados generados por humanos incluyen principalmente todos los datos que un humano introduce en un ordenador, como su nombre y otros detalles personales. Cuando una persona hace clic en un enlace en Internet, o incluso hace un movimiento en un juego, se crean datos que pueden ser utilizados por las empresas para averiguar el comportamiento de sus clientes y tomar las decisiones y modificaciones oportunas.

Scroll al inicio
Ir arriba