Definicion de big data segun autores
la importancia de los «big data»: una definición
En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software tradicional de procesamiento de datos no puede gestionarlos. Pero estos volúmenes masivos de datos pueden utilizarse para resolver problemas de negocio que antes no habrían podido abordarse.
La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.
La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.
En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.
definición de big data pdf
Big data se refiere a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las «tres v» del big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.
Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.
Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.
becario de big data
El tamaño es la primera, y a veces la única, dimensión que salta a la vista cuando se habla de big data. Este artículo trata de ofrecer una definición más amplia de big data que recoja sus otras características únicas y definitorias. La rápida evolución y adopción de los big data por parte de la industria ha hecho saltar el discurso a los medios populares, obligando a la prensa académica a ponerse al día. Las revistas académicas de numerosas disciplinas, que se beneficiarán de un debate relevante sobre big data, aún no han cubierto el tema. Este artículo presenta una descripción consolidada de los macrodatos, integrando definiciones de profesionales y académicos. El documento se centra principalmente en los métodos analíticos utilizados para los macrodatos. Un rasgo distintivo de este documento es que se centra en la analítica relacionada con los datos no estructurados, que constituyen el 95% de los big data. Este documento destaca la necesidad de desarrollar métodos analíticos adecuados y eficientes para aprovechar los volúmenes masivos de datos heterogéneos en formatos de texto, audio y vídeo no estructurados. Este trabajo también refuerza la necesidad de idear nuevas herramientas de análisis predictivo para los big data estructurados. Los métodos estadísticos en la práctica se idearon para inferir a partir de datos de muestra. La heterogeneidad, el ruido y el tamaño masivo de los big data estructurados exigen el desarrollo de algoritmos computacionalmente eficientes que puedan evitar las trampas de los big data, como la correlación espuria.
una definición formal de big data basada en sus características esenciales
El término big data hace referencia a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las «tres v» del big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.
Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.
Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.