Inicios del big data

Inicio » Inicios del big data

El término big data fue acuñado por los astrónomos cox y ellsworth en

Big Data es una colección de conjuntos de datos que describe una cantidad masiva de datos en el rango de zettabytes y yottabytes. Al tratar con estos grandes conjuntos de datos, las organizaciones se enfrentan a dificultades a la hora de crear, manipular y gestionar los Big Data, ya que las bases de datos y las técnicas de software tradicionales existentes son incapaces de procesar y analizar estos conjuntos de datos masivos. Estas tareas requieren nuevas herramientas y técnicas que puedan extraer información valiosa de los Big Data mediante algún proceso analítico. En este documento, añadimos nuevos atributos a los Big Data como la viabilidad, el coste y la consistencia, además de las 6 V y 1 C existentes, para hacer 7 V y 3 C de los Big Data. Este documento también introduce herramientas y técnicas asociadas a los Big Data que serán de gran importancia. Además, el documento analiza la configuración del clúster Hadoop e implementa un problema de ordenación en un archivo de 1 GB con un tamaño de clúster variable. El resultado muestra que con el aumento del tamaño del clúster el tiempo de procesamiento del trabajo se reduce significativamente.

… El estudio de big data es significativo porque un volumen creciente de empresas está explorando la capacidad de descubrir el conocimiento oculto, mejorar su capacidad de tomar decisiones y apoyar la planificación estratégica mediante el uso de la analítica de big data (Chiang, Grover, Ting-Peng, & Dongsong, 2018). El big data ha introducido una nueva generación de tecnologías, arquitecturas y capacidades que extraen valor de grandes volúmenes de datos

Cuáles son algunas herramientas de big data

Este artículo se adentra en el mundo del big data, la historia del big data desde sus inicios en el siglo XX hasta el big data tal y como lo conocemos ahora. El artículo también analiza algunas de las aplicaciones más destacadas del big data en el mundo en que vivimos.

En el panorama empresarial actual, la gestión de datos puede ser un factor determinante para el éxito o el fracaso. La mayoría de las empresas han empezado a darse cuenta de la importancia de incorporar estrategias que puedan transformarlas mediante la aplicación de big data. En este empeño, las empresas se están dando cuenta de que el big data no es simplemente una tecnología o técnica única. Más bien, el big data es una tendencia que se extiende por numerosos campos de los negocios y la tecnología.

Big Data es el término utilizado para referirse a las iniciativas y tecnologías que comprenden datos demasiado diversos, de rápida evolución y vastos para que las tecnologías, la infraestructura y las habilidades ordinarias puedan abordarlos exhaustivamente. Es decir, el volumen, la velocidad y la variedad de los datos son demasiado grandes. A pesar de la complejidad de estos datos, los avances tecnológicos están permitiendo a las empresas extraer valor de los big data.

Historia del big data ppt

El tamaño y el número de conjuntos de datos disponibles han crecido rápidamente a medida que los datos son recogidos por dispositivos como los móviles, los baratos y numerosos dispositivos de detección de información del Internet de las cosas, los aéreos (teledetección), los registros de software, las cámaras, los micrófonos, los lectores de identificación por radiofrecuencia (RFID) y las redes de sensores inalámbricos. [8][9] La capacidad tecnológica per cápita del mundo para almacenar información se ha duplicado aproximadamente cada 40 meses desde la década de 1980;[10] en 2012 [actualización], cada día se generaban 2,5 exabytes (2,5×260 bytes) de datos[11] Según la predicción de un informe de IDC, se preveía que el volumen mundial de datos crecería exponencialmente de 4,4 zettabytes a 44 zettabytes entre 2013 y 2020. Para 2025, IDC predice que habrá 163 zettabytes de datos[12]. Una cuestión para las grandes empresas es determinar quién debe ser el propietario de las iniciativas de big data que afectan a toda la organización[13].

Los sistemas de gestión de bases de datos relacionales y los paquetes de software estadístico de escritorio utilizados para visualizar los datos suelen tener dificultades para procesar y analizar los big data. El procesamiento y análisis de big data puede requerir “software masivamente paralelo que se ejecuta en decenas, cientos o incluso miles de servidores”[14] Lo que se califica como “big data” varía en función de las capacidades de quienes lo analizan y de sus herramientas. Además, la ampliación de las capacidades hace de los big data un objetivo móvil. “Para algunas organizaciones, enfrentarse a cientos de gigabytes de datos por primera vez puede provocar la necesidad de reconsiderar las opciones de gestión de datos. Para otras, pueden ser necesarias decenas o cientos de terabytes antes de que el tamaño de los datos se convierta en una consideración significativa”[15].

Cronología de la historia del big data

Los clics. Hace tiempo eran la herramienta más poderosa para evaluar el rendimiento de los anuncios en línea. Un comienzo humilde, pero mucho ha cambiado. Las tecnologías de medición y análisis predictivo basadas en datos que lanzaron la tecnología publicitaria y se expandieron al marketing se aplican ahora a casi todo, y sin embargo, es fácil olvidar el camino que llevó hasta aquí.

La tecnología publicitaria tiene fama de ser excesivamente complicada y de tener un precio excesivo; sin embargo, es en gran medida incomprendida. No sólo está infravalorada, sino también infravalorada.  La tecnología publicitaria es a los grandes datos lo que el Big Bang es al universo. La historia colectiva del origen de todos los datos de medición de la productividad comienza con la tecnología publicitaria. De medir el rendimiento de los anuncios, ahora podemos medir el rendimiento de casi todo, incluso de las personas.

Los departamentos de recursos humanos están incorporando la analítica a las tareas de contratación, retención y promoción de las empresas, y el sector de los seguros está utilizando los datos para influir en los clientes para que adquieran mejores hábitos de conducción.

Del mismo modo que LUMAscape ha evolucionado para la tecnología publicitaria, los nuevos ecosistemas están preparados para unirse en torno a otras industrias. Las empresas que dependen de los datos para tomar decisiones clave querrán una información mejor y más detallada. Así que el cambio hacia el análisis predictivo en múltiples sectores formará un círculo virtuoso, impulsando la demanda de herramientas para enriquecer e interpretar aún más todos esos datos.

Ir arriba