Big data y la privacidad

Inicio » Big data y la privacidad

Big data y privacidad: cuestiones emergentes

Estamos en el año 2020 y las empresas están invirtiendo mucho en programas de privacidad. La Asociación Internacional de Profesionales de la Privacidad (IAPP) define la privacidad de la información como “el derecho a tener cierto control sobre cómo se recoge y utiliza su información personal”. Motivados por la presión normativa (por ejemplo, el Reglamento General de Protección de Datos de la Unión Europea y la Ley de Privacidad del Consumidor de California), los directores de privacidad (CPO) están liderando iniciativas relacionadas con el descubrimiento de datos, la protección de datos, la aplicación de la privacidad y la presentación de informes de cumplimiento.

Al trabajar como director de estrategia de una empresa que realiza evaluaciones de seguridad y pruebas de penetración, he descubierto que un problema fundamental para que las empresas sean conscientes de la privacidad es que los datos son fluidos: se mueven continuamente en la empresa y se introducen nuevos datos todo el tiempo. A diferencia de los días en que los datos de la empresa existían en bases de datos relacionales perfectamente organizadas, ahora estamos en un mundo en el que las plataformas de datos masivos albergan grandes volúmenes de datos no estructurados o poco estructurados que luego alimentan complejos sistemas de análisis e inteligencia artificial (IA).

Riesgo en la privacidad de los datos

Estamos en el año 2020 y las empresas están invirtiendo mucho en programas de privacidad. La Asociación Internacional de Profesionales de la Privacidad (IAPP) define la privacidad de la información como “el derecho a tener cierto control sobre cómo se recoge y utiliza su información personal”. Motivados por la presión normativa (por ejemplo, el Reglamento General de Protección de Datos de la Unión Europea y la Ley de Privacidad del Consumidor de California), los directores de privacidad (CPO) están liderando iniciativas relacionadas con el descubrimiento de datos, la protección de datos, la aplicación de la privacidad y la presentación de informes de cumplimiento.

Al trabajar como director de estrategia de una empresa que realiza evaluaciones de seguridad y pruebas de penetración, he descubierto que un problema fundamental para que las empresas sean conscientes de la privacidad es que los datos son fluidos: se mueven continuamente en la empresa y se introducen nuevos datos todo el tiempo. A diferencia de los días en que los datos de la empresa existían en bases de datos relacionales perfectamente organizadas, ahora estamos en un mundo en el que las plataformas de datos masivos albergan grandes volúmenes de datos no estructurados o poco estructurados que luego alimentan complejos sistemas de análisis e inteligencia artificial (IA).

Privacidad de los grandes datos pdf

En los últimos años ha habido muchos titulares sobre violaciones de la privacidad derivadas de filtraciones de datos. Puede parecer que el big data es una amenaza para la privacidad de los datos. Sin embargo, la verdad es que los datos en sí no son el problema. El problema son los datos mal gestionados.

El big data sólo es un riesgo para la privacidad si se gestiona mal. Si una organización deja de utilizar los datos por miedo a que provoquen violaciones de la seguridad, estará cometiendo un gran error. Sin big data, las organizaciones tienen dificultades para entender a los clientes y tomar decisiones inteligentes basadas en datos.

Dado que los datos suelen estar alojados en la nube, en lugar de en un ordenador o una red física, una estrategia de gestión de datos cuidadosamente planificada es crucial para garantizar que los datos se mueven en la nube con un riesgo mínimo.

Dado que un problema de privacidad puede ocurrir en cualquier momento, las organizaciones deben encontrar una solución que supervise los datos en tiempo real. De esta manera, serán conscientes de un problema tan pronto como se produzca y podrán tomar las medidas adecuadas para resolverlo de inmediato.

Protección de los grandes datos

En 2012, se creaban 2,5 quintillones de bytes de datos al día. Los volúmenes de datos son enormes, la velocidad de generación de datos es rápida y el espacio de datos/información es global [9]. Se deben considerar algoritmos incrementales ligeros que sean capaces de lograr robustez, alta precisión y mínima latencia de preprocesamiento. Por ejemplo, en el caso de la minería, se puede utilizar un método de selección de características ligero mediante el uso de Swarm Search y PSO acelerado en lugar de los métodos de clasificación tradicionales [10]. Más adelante, el Internet de las Cosas (IoT) llevará a la conexión de todas las cosas que le importan a la gente en el mundo, debido a lo cual se producirán muchos más datos que en la actualidad [11]. De hecho, la IO es una de las principales fuerzas impulsoras del análisis de grandes datos [9].

La privacidad y la seguridad en términos de big data es una cuestión importante. El modelo de seguridad de big data no se sugiere en el caso de aplicaciones complejas, por lo que se desactiva por defecto. Sin embargo, en su ausencia, los datos siempre pueden verse comprometidos fácilmente. Por ello, esta sección se centra en las cuestiones de privacidad y seguridad.

Ir arriba