De donde provienen los datos de big data

Inicio » De donde provienen los datos de big data

cómo funciona el big data

Big data es un término que describe los grandes volúmenes de datos difíciles de gestionar -tanto estructurados como no estructurados- que inundan las empresas en su día a día. Pero lo importante no es sólo el tipo o la cantidad de datos, sino lo que las organizaciones hacen con ellos. Los grandes datos pueden analizarse para obtener información que mejore las decisiones y dé confianza para tomar medidas empresariales estratégicas.

El término “big data” se refiere a los datos que son tan grandes, rápidos o complejos que son difíciles o imposibles de procesar con los métodos tradicionales. El acto de acceder y almacenar grandes cantidades de información para su análisis existe desde hace mucho tiempo. Pero el concepto de big data cobró impulso a principios de la década de 2000, cuando el analista de la industria Doug Laney articuló la definición de big data, que ahora es la corriente principal, como las tres V:

Volumen.  Las organizaciones recopilan datos de una gran variedad de fuentes, como transacciones, dispositivos inteligentes (IoT), equipos industriales, vídeos, imágenes, audio, redes sociales y mucho más. En el pasado, almacenar todos esos datos habría sido demasiado costoso, pero el almacenamiento más barato mediante lagos de datos, Hadoop y la nube ha aliviado la carga.

big data v

El término big data se refiere a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las “tres v” de los big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.

Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.

Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.

big data youtube

Las plataformas de big data están especialmente diseñadas para manejar volúmenes insondables de datos que entran en el sistema a gran velocidad y con gran variedad. Estas plataformas de big data suelen consistir en diversos servidores, bases de datos y herramientas de inteligencia empresarial que permiten a los científicos de datos manipular los datos para encontrar tendencias y patrones.

Para comprender la enormidad de la diferencia de escala, considere esta comparación de la Escuela de Información de Berkeley: un gigabyte es el equivalente a un vídeo de siete minutos en HD, mientras que un solo zettabyte equivale a 250.000 millones de DVD.

Las empresas y organizaciones deben tener la capacidad de aprovechar estos datos y generar ideas a partir de ellos en tiempo real, de lo contrario no son muy útiles. El procesamiento en tiempo real permite a los responsables de la toma de decisiones actuar con rapidez, lo que les da una ventaja sobre la competencia.

Mientras que algunas formas de datos pueden procesarse por lotes y seguir siendo relevantes a lo largo del tiempo, gran parte de los big data llegan a las organizaciones a toda velocidad y requieren una acción inmediata para obtener los mejores resultados. Los datos de los sensores de los dispositivos sanitarios son un buen ejemplo. La capacidad de procesar instantáneamente los datos sanitarios puede proporcionar a los usuarios y a los médicos información que podría salvarles la vida.

historia del big data

En los últimos cinco años, se ha comprendido cada vez mejor el papel que pueden desempeñar los macrodatos a la hora de proporcionar información de valor incalculable a una organización, revelando sus puntos fuertes y débiles y permitiendo a las empresas mejorar sus prácticas. Los macrodatos no tienen una agenda, no juzgan ni son partidistas: simplemente revelan una instantánea de la actividad.

Sin embargo, aunque muchas organizaciones comprenden la importancia de los datos, muy pocas ven todavía su impacto. Un nuevo estudio titulado Broken Links: Why analytics have yet to pay off (Enlaces rotos: por qué la analítica aún no ha dado sus frutos) afirma que el 70% de los ejecutivos de las empresas reconocen la importancia de la analítica de ventas y marketing, pero sólo el 2% afirma que su analítica ha logrado un impacto amplio y positivo. Este hallazgo apunta a la necesidad de que el Big Data sea manejado por empresas subcontratadas que se especialicen en el análisis de los datos generados por las empresas y que puedan ofrecer perspectivas reales y procesables. En el prólogo de su informe, Dan Weatherill escribe que “Nuestra encuesta y las entrevistas de seguimiento realizadas a casi 450 altos ejecutivos con sede en Estados Unidos de sectores como el farmacéutico, los dispositivos médicos, la informática, los servicios financieros, las telecomunicaciones y los viajes y la hostelería confirmaron una cosa que ya sabíamos: pocas organizaciones han sido capaces de acertar y de generar el tipo de impacto empresarial que esperaban”.

Ir arriba