Como crear un big data

Inicio » Como crear un big data

Savia de grandes datos

Es difícil saber por dónde empezar una vez que has decidido que, sí, quieres sumergirte en el fascinante mundo de los datos y la IA. El mero hecho de ver todas las tecnologías que tienes que entender y las herramientas que debes dominar puede resultar vertiginoso. ¿Qué pasos de ciencia de datos debes dar primero?

A continuación, presentamos nuestra definición de un proyecto de datos a través de los pasos fundamentales de un plan de proyecto de análisis de datos en esta emocionante era de la IA, el aprendizaje automático y el big data. Estos siete pasos de la ciencia de los datos le ayudarán a asegurarse de que obtiene valor comercial de cada proyecto único y a mitigar el riesgo de error.

Entender el negocio o la actividad en la que se enmarca su proyecto de datos es clave para garantizar su éxito y la primera fase de cualquier proyecto de análisis de datos sólido. Para motivar a los diferentes actores necesarios para que su proyecto pase del diseño a la producción, su proyecto debe ser la respuesta a una clara necesidad organizativa. Antes de pensar en los datos, salga a hablar con las personas de su organización cuyos procesos o cuyo negocio pretende mejorar con los datos. A continuación, siéntate a definir un calendario y unos indicadores clave de rendimiento concretos. Lo sé, la planificación y los procesos parecen aburridos, pero, al fin y al cabo, son un primer paso esencial para poner en marcha tu iniciativa de datos.

Tutorial de big data

Un lago de datos es un repositorio centralizado que le permite almacenar todos sus datos estructurados y no estructurados a cualquier escala. Puede almacenar sus datos tal y como están, sin tener que estructurarlos primero, y ejecutar diferentes tipos de análisis, desde cuadros de mando y visualizaciones hasta el procesamiento de big data, el análisis en tiempo real y el aprendizaje automático para orientar mejores decisiones.

Las organizaciones que generen con éxito valor de negocio a partir de sus datos, superarán a sus pares. Un estudio de Aberdeen observó que las organizaciones que implementaron un lago de datos superaron a empresas similares en un 9% en el crecimiento de los ingresos orgánicos. Estos líderes fueron capaces de realizar nuevos tipos de análisis, como el aprendizaje automático, a partir de nuevas fuentes, como los archivos de registro, los datos de los flujos de clics, las redes sociales y los dispositivos conectados a Internet almacenados en el lago de datos. Esto les ayudó a identificar las oportunidades de crecimiento del negocio y a actuar sobre ellas con mayor rapidez, atrayendo y reteniendo a los clientes, impulsando la productividad, manteniendo proactivamente los dispositivos y tomando decisiones informadas.

Ejemplos de big data

El Internet de las cosas (IoT) es un subconjunto especializado de las soluciones de big data. El siguiente diagrama muestra una posible arquitectura lógica para IoT. El diagrama hace hincapié en los componentes de flujo de eventos de la arquitectura.

Los dispositivos pueden enviar eventos directamente a la pasarela de la nube o a través de una pasarela de campo. Una pasarela de campo es un dispositivo o software especializado, normalmente colocado con los dispositivos, que recibe los eventos y los reenvía a la pasarela de la nube. La pasarela de campo también puede preprocesar los eventos brutos de los dispositivos, realizando funciones como el filtrado, la agregación o la transformación de protocolos.

Esta sección ha presentado una visión de muy alto nivel de la IO, y hay muchas sutilezas y retos que considerar. Para obtener una arquitectura de referencia más detallada y un debate, consulte la Arquitectura de referencia de Microsoft Azure IoT (descarga en PDF).

Infraestructura de big data

Hace cinco años, la mayoría de las empresas recopilaban datos que formaban parte de sus transacciones diarias y los almacenaban en una base de datos. Estos datos se utilizaban principalmente para hacer un seguimiento de las operaciones o prever las necesidades. Hoy en día, tanto las fuentes como el volumen de datos recogidos se han disparado. Ahora es posible recoger datos de flujo de clics sobre cada interacción de un cliente potencial con su sitio web. Los profesionales del marketing también pueden recopilar información sobre cada conversación que la gente mantiene sobre su marca.    Estas fuentes de datos han creado un tesoro moderno que puede ser explotado para obtener información sobre productos, servicios y clientes. Aunque esto es conceptualmente posible, requiere la implementación de nuevos procesos, tecnología y mecanismos de gobernanza que se denominan colectivamente big data. Hoy en día, el big data es un gran negocio.

Definimos “big data” como una capacidad que permite a las empresas extraer valor de grandes volúmenes de datos. Como cualquier capacidad, requiere inversiones en tecnologías, procesos y gobernanza. La empresa de investigación IDC prevé que el mercado de servicios y tecnología de big data aumentará su valor de 3.200 millones de dólares en 2010 a 16.900 millones en 20151.

Ir arriba