¿Cómo empezar con el big data?

Inicio » ¿Cómo empezar con el big data?

Curso de gestión de Big Data

¿Está interesado en comprender el “Big Data” más allá de los términos utilizados en los titulares? Entonces selecciona esta ruta de aprendizaje como introducción a herramientas como Apache Hadoop y Apache Spark Frameworks, que permiten analizar los datos en masa, y comienza el viaje hacia el descubrimiento de tus titulares.

Los datos se componen de bits y bytes, y como humanos estamos inmersos en datos en nuestra vida cotidiana. El valor que tienen los datos sólo puede entenderse cuando podemos empezar a identificar patrones y tendencias dentro de los datos que luego desencadenan preguntas para entender mejor el impacto de nuestras acciones. Esta ruta de aprendizaje está diseñada para que los participantes pasen de una comprensión inicial de los términos y conceptos de Big Data a trabajar con conjuntos de herramientas para profundizar en los propios datos y empezar a identificar los patrones y tendencias que de otro modo pasarían desapercibidos. Acompáñenos y comience su viaje para recibir las siguientes insignias: Fundamentos de Big Data.

¿Cómo de grande es lo grande y por qué importa lo grande y qué tiene que ver Apache Hadoop con ello? En este curso verás el panorama de Big Data y aprenderás la terminología utilizada en las discusiones sobre Big Data.

Curso de big data

Big Data describe la recopilación de conjuntos de datos complejos y de gran tamaño que son difíciles de capturar, procesar, almacenar, buscar y analizar mediante un sistema de base de datos convencional que ofrece más información cualitativa en nuestra vida cotidiana.

Sin embargo, si usted es una persona no lectora y del tipo “Oh, mierda, ¿4 líneas sólo para una definición?” (créame, yo pertenezco a la misma categoría), entonces sólo eche un vistazo a la imagen de abajo, probablemente se hará una idea.

Ahora que ya sabes el qué, el por qué y el dónde, hablemos un poco del ‘cómo’, de cómo empezar con ello, de los conocimientos básicos que necesitas, de los blogs a los que debes prestar atención, de los MOOCs (Massive open online courses) que debes tomar, de los Data Scientist que debes seguir hoy en día, en definitiva, de tu primer paso para avanzar en la carrera de Data Science. En la próxima sección, voy a tratar de cubrir más en el escenario general del campo de la Ciencia de Datos en lugar de ella porque las habilidades seguirán siendo los mismos en un cierto nivel. Todo lo que necesitas hacer es escribir lo que exactamente quieres ir a por ello y simplemente trabajar para ello.

Cómo dominar el big data

Obtenga la orientación arquitectónica que necesita para crear sus aplicaciones de Big Data aprovechando al máximo la infraestructura de la nube de AWS. Consulte el Centro de Arquitectura de AWS y encuentre la arquitectura de referencia para su aplicación. Visite el Centro de Arquitectura.

La sección de documentos técnicos ofrece una lista completa de documentos técnicos de AWS, que abarcan temas como la arquitectura, la seguridad y la economía. Estos documentos técnicos han sido redactados por el equipo de AWS, analistas independientes o la comunidad de AWS (clientes o socios).

El curso Big Data Technology Fundamentals es perfecto para empezar a aprender a ejecutar aplicaciones de big data en la nube de AWS. Se trata de un curso de formación en línea gratuito y está dirigido a personas que se inician en los conceptos de big data, incluidos arquitectos de soluciones, científicos de datos y analistas de datos.

Crear y ejecutar una aplicación en AWS es fácil.    Todos los meses, los empleados de AWS organizan seminarios web para ayudarle a obtener más información sobre AWS y cómo puede sacar el máximo partido a la nube.    Estos seminarios web también se guardan en línea para que pueda compartir un seminario web que haya disfrutado con otros, así como ver seminarios web anteriores que parezcan interesantes.

Aprender big data para principiantes

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos tradicional no puede gestionarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Ir arriba