Veracidad en big data

Inicio » Veracidad en big data

Ventajas del big data

Este curso es para aquellos que son nuevos en la ciencia de los datos. No se necesita experiencia previa en programación, aunque la capacidad de instalar aplicaciones y utilizar una máquina virtual es necesaria para completar las tareas prácticas.

(A) Procesador de cuatro núcleos (se recomienda que sea compatible con VT-x o AMD-V), de 64 bits; (B) 8 GB de RAM; (C) 20 GB de disco libre. Cómo encontrar la información de su hardware: (Windows): Abra Sistema haciendo clic en el botón Inicio, haciendo clic con el botón derecho del ratón en Equipo y luego en Propiedades; (Mac): Abra Visión general haciendo clic en el menú Apple y en “Acerca de este Mac”. La mayoría de los ordenadores con 8 GB de RAM adquiridos en los últimos 3 años cumplirán los requisitos mínimos.Necesitará una conexión a Internet de alta velocidad porque descargará archivos de hasta 4 Gb de tamaño.

7

Todo el ecosistema de herramientas de Big Data rara vez brilla sin esos tres ingredientes. Sin las tres V, probablemente sea mejor no utilizar soluciones de Big Data en absoluto y, en su lugar, limitarse a ejecutar un back-end más tradicional.

Aunque las tres V son el núcleo de atributos más aceptado, hay varias extensiones que pueden considerarse. Las cinco V de Big Data amplían las tres ya cubiertas con dos características más: veracidad y valor.

En general, la veracidad de los datos se define como la exactitud o veracidad de un conjunto de datos. En muchos casos, la veracidad de los conjuntos de datos puede rastrearse hasta la procedencia de la fuente. De este modo, muchos hablan de fuentes, tipos o procesos de datos fiables. Sin embargo, cuando se combinan múltiples fuentes de datos, por ejemplo, para aumentar la variedad, la interacción entre los conjuntos de datos y el panorama resultante no homogéneo de la calidad de los datos puede ser difícil de rastrear.

Es importante no confundir la veracidad con la interpretabilidad. Incluso con datos precisos, las interpretaciones erróneas en los análisis pueden llevar a conclusiones equivocadas. Sin embargo, esto no es en principio una propiedad del conjunto de datos, sino de los métodos analíticos y del planteamiento del problema.

Big data 4 v

Vishnu Pendyala es miembro sénior del IEEE y de la Sociedad Informática de la India (CSI), con más de dos décadas de experiencia en software con líderes del sector como Cisco, Synopsys, Informix (ahora IBM) y Electronics Corporation of India Limited. Forma parte del consejo ejecutivo de la CSI, es miembro del Grupo de Interés Especial en Análisis de Grandes Datos y es el editor fundador de su publicación insignia, Visleshana. Recientemente ha impartido un curso de corta duración sobre “Big Data Analytics for Humanitarian Causes”, patrocinado por el Ministerio de Recursos Humanos del Gobierno de la India en el marco del programa GIAN, y ha realizado múltiples presentaciones en conferencias internacionales patrocinadas por el IEEE.  Vishnu lleva más de dos décadas viviendo y trabajando en Silicon Valley.

Ejemplos de big data

Los big data van más allá del volumen, la variedad y la velocidad. Debe conocer estas 10 características y propiedades de los big data para prepararse para los retos y las ventajas de las iniciativas de big data.

El término big data empezó a aparecer de forma escasa a principios de la década de 1990, y su prevalencia e importancia aumentaron exponencialmente con el paso de los años. Hoy en día, el término big data se considera a menudo parte integrante de la estrategia de datos de una empresa.

Puede que haya oído hablar de las tres “V” de los big data, pero creo que hay otras siete características importantes que debe conocer. Convenientemente, cada una de estas propiedades también empieza por v, así que vamos a hablar de las 10 V de los big data.

El volumen es probablemente la característica más conocida de los big data; esto no es una sorpresa, teniendo en cuenta que más del 90 por ciento de todos los datos actuales se han creado en los últimos dos años. La cantidad actual de datos puede ser realmente asombrosa. He aquí algunos ejemplos:

— Se estima que en 2016 se tomaron 1,1 billones de fotos, y se prevé que esa cifra aumente un 9 por ciento en 2017. Como la misma foto suele tener múltiples instancias almacenadas en diferentes dispositivos, servicios de intercambio de fotos o documentos, así como servicios de redes sociales, también se espera que el número total de fotos almacenadas aumente de 3,9 billones en 2016 a 4,7 billones en 2017.

Ir arriba