¿Qué es la minería de datos y para qué sirve?

Inicio » ¿Qué es la minería de datos y para qué sirve?

Minería de datos einfach erklärt

La minería de datos, también conocida como descubrimiento de conocimiento en los datos (KDD), es el proceso de descubrir patrones y otra información valiosa a partir de grandes conjuntos de datos. Dada la evolución de la tecnología de almacenamiento de datos y el crecimiento de los big data, la adopción de las técnicas de minería de datos se ha acelerado rápidamente en las últimas dos décadas, ayudando a las empresas a transformar sus datos brutos en conocimiento útil. Sin embargo, a pesar de que la tecnología evoluciona continuamente para manejar los datos a gran escala, los líderes todavía se enfrentan a desafíos con la escalabilidad y la automatización.

La minería de datos ha mejorado la toma de decisiones de las organizaciones a través de análisis de datos perspicaces. Las técnicas de minería de datos que sustentan estos análisis pueden dividirse en dos propósitos principales: pueden describir el conjunto de datos objetivo o pueden predecir resultados mediante el uso de algoritmos de aprendizaje automático. Estos métodos se utilizan para organizar y filtrar los datos, sacando a la luz la información más interesante, desde la detección de fraudes hasta los comportamientos de los usuarios, los cuellos de botella e incluso las brechas de seguridad.

Tipos de datos en la minería de datos

La minería de datos es un proceso de extracción y descubrimiento de patrones en grandes conjuntos de datos que implica métodos en la intersección del aprendizaje automático, la estadística y los sistemas de bases de datos[1]. La minería de datos es un subcampo interdisciplinario de la informática y la estadística con el objetivo general de extraer información (con métodos inteligentes) de un conjunto de datos y transformar la información en una estructura comprensible para su uso posterior[1][2][3][4]. [1][2][3][4] La minería de datos es la etapa de análisis del proceso de “descubrimiento de conocimiento en bases de datos”, o KDD[5]. Además de la etapa de análisis en bruto, también implica aspectos de gestión de bases de datos y datos, preprocesamiento de datos, consideraciones de modelo e inferencia, métricas de interés, consideraciones de complejidad, posprocesamiento de las estructuras descubiertas, visualización y actualización en línea[1].

El término “minería de datos” es un término erróneo, ya que el objetivo es la extracción de patrones y conocimientos a partir de grandes cantidades de datos, no la extracción (minería) de los datos en sí[6]. También es una palabra de moda[7] y se aplica con frecuencia a cualquier forma de procesamiento de datos o información a gran escala (recopilación, extracción, almacenamiento, análisis y estadística), así como a cualquier aplicación de sistema informático de apoyo a la toma de decisiones, incluida la inteligencia artificial (por ejemplo, el aprendizaje automático) y la inteligencia empresarial. El libro Data mining: Practical machine learning tools and techniques with Java[8] (que cubre principalmente material de aprendizaje automático) iba a llamarse originalmente sólo Practical machine learning, y el término minería de datos sólo se añadió por razones de marketing[9] A menudo los términos más generales (a gran escala) análisis de datos y analítica -o, cuando se refiere a los métodos reales, inteligencia artificial y aprendizaje automático- son más apropiados.

Ejemplos de minería de datos

serie de libros (SAPERE, volumen 3)ResumenDebido a los recientes avances tecnológicos, es posible generar y almacenar conjuntos de datos cada vez más grandes. Sin embargo, el valor de los datos no depende de su cantidad, sino de la capacidad de interpretarlos y analizarlos, y de basar las políticas y decisiones futuras en el resultado del análisis. Las cantidades de datos recopilados hoy en día no sólo ofrecen oportunidades sin precedentes para mejorar los procedimientos de decisión de empresas y gobiernos, sino que también plantean grandes retos. Muchas herramientas de análisis de datos preexistentes no se adaptan a los tamaños de datos actuales. De esta necesidad surgió el campo de investigación de la minería de datos. En este capítulo situamos la minería de datos con respecto a otras técnicas de análisis de datos y presentamos las clases más importantes de técnicas desarrolladas en el área: la minería de patrones, la clasificación y la agrupación y detección de valores atípicos. También se analizan técnicas de apoyo relacionadas, como el preprocesamiento y el acoplamiento de bases de datos.Palabras claveMinería de datos Detección de valores atípicos Minería de patrones Minería de reglas de asociación Límite de clase

Minería de datos, ¿por qué es importante?

La minería de datos es el proceso de descubrir información dentro de un conjunto de datos; también se conoce como descubrimiento de conocimientos en bases de datos (KDD). Hay dos resultados de la minería de datos que se pueden conseguir: describir los datos que se tienen o hacer predicciones para el futuro.

El primer paso, y quizás el más difícil, en la minería de datos es establecer el objetivo empresarial. También es el más crítico. Si usted no sabe lo que está buscando, será difícil seleccionar los tipos de Machine Learning ML, algoritmos y modelos para obtener la información que necesita.

La minería de datos puede ayudar en las ventas y el marketing, de modo que una empresa entienda mejor a sus clientes y el marketing. Las escuelas y universidades pueden utilizarla para entender mejor a sus estudiantes, basándose en información como el tiempo que pasan en un aula virtual, el número de pulsaciones de teclas, las clases que los estudiantes tomaron simultáneamente, o qué clases tienen más éxito en los exámenes.

Las corporaciones también pueden utilizar la minería de datos para optimizar las operaciones mediante la comprensión de la fabricación, el montaje, los fallos y las averías, entre otras cosas. También es beneficiosa para la detección de fraudes. La banca puede utilizar la minería de datos para buscar los patrones de fraude o incluso la tienda que ha sido comprometida.

Ir arriba