Cuando se considera big data

Inicio » Cuando se considera big data

Fuentes de big data

Big Data es una base de datos diferente y avanzada de la base de datos estándar. Las bases de datos relacionales estándar son eficaces para almacenar y procesar datos estructurados. Utilizan la tabla para almacenar los datos y el lenguaje de consulta estructurado (SQL) para acceder y recuperar los datos. BigData es el tipo de datos que incluye datos no estructurados y semiestructurados. Hay tipos específicos de bases de datos conocidos como bases de datos NoSQL, Hay varios tipos de bases de datos NoSQL y herramientas disponibles para almacenar y procesar los Big Data. Las bases de datos NoSQL están optimizadas para el análisis de datos utilizando el BigData como texto, imágenes, logos y otros formatos de datos como XML, JSON. El Big Data es útil para desarrollar aplicaciones inteligentes basadas en datos.

Es una colección organizada de datos estructurados. Es una colección de información relacionada. La base de datos almacena y accede a los datos electrónicamente.    Una base de datos se almacena como un archivo o un conjunto de archivos en un disco magnético o cinta, disco óptico o algún otro dispositivo de almacenamiento secundario. Es una estructura de datos que almacena información organizada. Se administran para facilitar el almacenamiento de datos, la recuperación de datos, la modificación de datos y la eliminación de datos. Permite procesar diversas operaciones de tratamiento de datos. Las bases de datos refuerzan el almacenamiento y el control de la información. Las bases de datos simplifican la administración de la información. Cualquier desarrollador de bases de datos con ciertos conjuntos de sintaxis puede procesar puede trabajar en la base de datos.

Valor de los big data

El modelado de datos es una ciencia compleja que consiste en organizar los datos corporativos para que se ajusten a las necesidades de los procesos empresariales. Requiere el diseño de relaciones lógicas para que los datos puedan interrelacionarse entre sí y dar soporte al negocio. Los diseños lógicos se traducen luego en modelos físicos que consisten en dispositivos de almacenamiento, bases de datos y archivos que albergan los datos.

Históricamente, las empresas han utilizado la tecnología de bases de datos relacionales, como SQL, para desarrollar modelos de datos porque es la más adecuada para vincular de forma flexible las claves de los conjuntos de datos y los tipos de datos con el fin de respaldar las necesidades de información de los procesos empresariales.

Desgraciadamente, el big data, que ahora comprende un gran porcentaje de los datos que se gestionan, no se ejecuta en bases de datos relacionales. Se ejecuta en bases de datos no relacionales, como las NoSQL. Esto lleva a pensar que no se necesita un modelo para el big data.

Los datos tradicionales de registro fijo son estables y predecibles en su crecimiento. Esto hace que sea relativamente fácil de modelar. En cambio, el crecimiento exponencial de los big data es imprevisible, al igual que sus innumerables formas y fuentes. Cuando los sitios contemplan el modelado de big data, el esfuerzo de modelado debe centrarse en la construcción de interfaces de datos abiertas y elásticas, porque nunca se sabe cuándo podría surgir una nueva fuente o forma de datos. Esto no es una prioridad en el mundo tradicional de los datos de registros fijos.

Ejemplos de big data

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos tradicional no puede gestionarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Uso de los big data

Reimpresión: R1210C Los autores escriben que el big data es mucho más poderoso que la analítica del pasado. Los directivos pueden medir y, por tanto, gestionar con más precisión que nunca. Pueden hacer mejores predicciones y tomar decisiones más inteligentes. Pueden dirigir intervenciones más eficaces en áreas que hasta ahora han estado dominadas por el instinto y la intuición en lugar de por los datos y el rigor. Las diferencias entre el big data y la analítica son una cuestión de volumen, velocidad y variedad: Ahora cruzan por Internet más datos cada segundo que los que se almacenaban en todo Internet hace 20 años. La información casi en tiempo real permite a una empresa ser mucho más ágil que sus competidores. Y esa información puede proceder de redes sociales, imágenes, sensores, la web u otras fuentes no estructuradas. Sin embargo, los retos de gestión son muy reales. Los responsables de la toma de decisiones de alto nivel tienen que aprender a hacer las preguntas correctas y adoptar una toma de decisiones basada en pruebas. Las organizaciones deben contratar a científicos que puedan encontrar patrones en conjuntos de datos muy grandes y traducirlos en información empresarial útil. Los departamentos de TI tienen que trabajar duro para integrar todas las fuentes de datos internas y externas relevantes. Los autores ofrecen dos casos de éxito para ilustrar cómo las empresas están utilizando el big data: PASSUR Aerospace permite a las aerolíneas hacer coincidir sus tiempos de llegada reales con los estimados. Sears Holdings analiza directamente los datos de sus tiendas para hacer promociones mucho más precisas y rápidas.

Ir arriba