-
Tipo
Cursos
-
Modalidad
Online / A distancia (+)
-
Duración / Créditos
28 Créditos ECTS
-
Fechas
Matric. Permanente
-
Sedes
Barcelona/Madrid
Información general
DESCRIPCIÓN:
A través del curso de Cloudera Data Analyst Training aprenderás a aplicar análisis de datos tradicionales y obtendrás la habilidad de gestionar las herramientas de inteligencia de negocio para el big data, logrando ser un profesional destacado e indispensable en toda área a la que te dediques, además, contarás con una serie de herramientas necesarias para manipular y analizar conjuntos de datos complejos utilizando SQL.
Cabe destacar que dicho curso ofrece un amplio contenido formativo de calidad, el cual será organizado por los mejores docentes del sector, los cuales asegurarán una formación de calidad.
Cabe destacar que dicho curso ofrece un amplio contenido formativo de calidad, el cual será organizado por los mejores docentes del sector, los cuales asegurarán una formación de calidad.
ASPECTOS A TENER EN CUENTA
FINALIDAD DEL PROGRAMA FORMATIVO:
Lograr la comprensión detallada de las funciones analíticas y las funciones de ventana y uso de ambas.
Capacitar a cada usuario para trabajar de manera exitosa en el análisis de datos tradicionales.
Obtener la habilidad de gestionar las herramientas de inteligencia de negocio para el big data.
Dirigirse a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, y administradores de bases de datos, garantizando así su éxito y desarrollo profesional.
Capacitar a cada usuario para trabajar de manera exitosa en el análisis de datos tradicionales.
Obtener la habilidad de gestionar las herramientas de inteligencia de negocio para el big data.
Dirigirse a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, y administradores de bases de datos, garantizando así su éxito y desarrollo profesional.
¿A quién va dirigido?
Curso dirigido a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, arquitectos de sistemas y administradores de bases de datos. Se requieren conocimientos de SQL y estar familiarizado con comandos de Linux. Aunque no es obligatorio, se recomienda el manejo de algún lenguaje de scripting (Bash scripting, Perl, Python, Ruby). No son necesarios conocimientos de Hadoop.
TITULACIÓN
Cloudera Data Analyst Training
TEMARIO
CONTENIDOS
INTRODUCCIÓN
FUNDAMENTOS HADOOP
- ¿Por qué Hadoop?
- Aspectos generales de Hadoop
- Almacenamiento de datos: HDFS
- Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
- Procesamiento y análisis de datos: Hive, e Impala
- Integración de datos: Sqoop
- Otras herramientas de datos de Hadoop
- Explicación del escenario con ejercicios
INTRODUCCIÓN A HIVE E IMPALA
- ¿Qué es Hive?
- ¿Qué es Impala?
- ¿Por qué utilizar Hive e Impala?
- Schema y almacenamiento de datos
- Comparación entre Hive y bases de datos tradicionales
- Casos de uso
CONSULTAS CON HIVE E IMPALA
- Tablas y bases de datos
- Sintaxis básica en consultas Hive e Impala
- Tipos de datos
- Empleo de Hue para ejecutar consultas
- Empleo de Beeline (la Shell de Hive)
- Empleo de la Shell de Impala
OPERADORES COMUNES Y FUNCIONES INTEGRADAS
- Operadores
- Funciones escalares
- Funciones de agregación
ADMINISTRACIÓN DE DATOS
- Almacenamiento de datos
- Creación de bases de datos y tablas
- Carga de datos
- Alteración de bases de datos y tablas
- Simplificación de consultas con vistas
- Almacenamiento de resultados de consultas
ALMACENAMIENTO DE DATOS Y RENDIMIENTO
- Partición de tablas
- Carga de datos en tablas particionadas
- Cuándo utilizar el particionamiento
- Elección del formato de archivo
- Uso de los formatos de archivo Avro y Parquet
TRABAJANDO CON MÚLTIPLES DATASETS
- UNION y Joins
- Manejo de valores NULL en Joins
- Joins avanzados
FUNCIONES ANALÍTICAS Y FUNCIONES DE VENTANA
- Utilización de funciones analíticas comunes
- Otras funciones analíticas
- Ventanas deslizantes
DATOS COMPLEJOS
- Datos complejos con Hive
- Datos complejos con Impala
ANÁLISIS DE TEXTO
- Empleo de expresiones regulares
- Procesamiento de texto con SerDes en Hive
- Análisis de Sentiment y n-grams
OPTIMIZACIÓN HIVE
- Rendimiento de las consultas
- Bucketing
- Indexación de datos
- Hive en Spark
OPTIMIZACIÓN DE IMPALA
- Ejecución de consultas
- Mejorar el rendimiento de Impala
EXTENDIENDO HIVE E IMPALA
- Customizar SerDes y formatos de archivo en Hive
- Transformación de datos con Scripts personalizados en Hive
- Funciones definidas por el usuario
- Consultas parametrizadas
ELECCIÓN DE LA MEJOR OPCIÓN
- Comparación entre MapReduce, Hive, Impala, y bases de datos relacionales
- ¿Cuál elegir?
CONCLUSIÓN
APACHE KUDU
- ¿Qué es Kudu?
- Tablas Kudu
- Uso de Impala con Kudu
INTRODUCCIÓN
FUNDAMENTOS HADOOP
- ¿Por qué Hadoop?
- Aspectos generales de Hadoop
- Almacenamiento de datos: HDFS
- Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
- Procesamiento y análisis de datos: Hive, e Impala
- Integración de datos: Sqoop
- Otras herramientas de datos de Hadoop
- Explicación del escenario con ejercicios
INTRODUCCIÓN A HIVE E IMPALA
- ¿Qué es Hive?
- ¿Qué es Impala?
- ¿Por qué utilizar Hive e Impala?
- Schema y almacenamiento de datos
- Comparación entre Hive y bases de datos tradicionales
- Casos de uso
CONSULTAS CON HIVE E IMPALA
- Tablas y bases de datos
- Sintaxis básica en consultas Hive e Impala
- Tipos de datos
- Empleo de Hue para ejecutar consultas
- Empleo de Beeline (la Shell de Hive)
- Empleo de la Shell de Impala
OPERADORES COMUNES Y FUNCIONES INTEGRADAS
- Operadores
- Funciones escalares
- Funciones de agregación
ADMINISTRACIÓN DE DATOS
- Almacenamiento de datos
- Creación de bases de datos y tablas
- Carga de datos
- Alteración de bases de datos y tablas
- Simplificación de consultas con vistas
- Almacenamiento de resultados de consultas
ALMACENAMIENTO DE DATOS Y RENDIMIENTO
- Partición de tablas
- Carga de datos en tablas particionadas
- Cuándo utilizar el particionamiento
- Elección del formato de archivo
- Uso de los formatos de archivo Avro y Parquet
TRABAJANDO CON MÚLTIPLES DATASETS
- UNION y Joins
- Manejo de valores NULL en Joins
- Joins avanzados
FUNCIONES ANALÍTICAS Y FUNCIONES DE VENTANA
- Utilización de funciones analíticas comunes
- Otras funciones analíticas
- Ventanas deslizantes
DATOS COMPLEJOS
- Datos complejos con Hive
- Datos complejos con Impala
ANÁLISIS DE TEXTO
- Empleo de expresiones regulares
- Procesamiento de texto con SerDes en Hive
- Análisis de Sentiment y n-grams
OPTIMIZACIÓN HIVE
- Rendimiento de las consultas
- Bucketing
- Indexación de datos
- Hive en Spark
OPTIMIZACIÓN DE IMPALA
- Ejecución de consultas
- Mejorar el rendimiento de Impala
EXTENDIENDO HIVE E IMPALA
- Customizar SerDes y formatos de archivo en Hive
- Transformación de datos con Scripts personalizados en Hive
- Funciones definidas por el usuario
- Consultas parametrizadas
ELECCIÓN DE LA MEJOR OPCIÓN
- Comparación entre MapReduce, Hive, Impala, y bases de datos relacionales
- ¿Cuál elegir?
CONCLUSIÓN
APACHE KUDU
- ¿Qué es Kudu?
- Tablas Kudu
- Uso de Impala con Kudu
SALIDAS PROFESIONALES
Con esta formación podrás ejercer como profesional cualificado en puestos de trabajo de:
- Data Scientist.
- Arquitecto de soluciones Big Data
- Administrador y/o desarrollador de sistemas Big Data
- Chief Data Officer (CDO).
- Machine Learning Engineer.
- Business Analyst.
- Big Data Consultant.
- Analista de datos (Data Analyst)
- Big Data Developer.
- Big Data Engineer.
- Data Analyst.
- NLP Consultant.
TE RECOMENDAMOS VER TAMBIÉN
En los siguientes enlaces podrás ver programas formativos similares:
UBICACIONES DE NUESTRAS SEDES
-
Barcelona
Avinguda Diagonal, 98-100 - Distrito 22
-
Madrid
c/ Arregui y Aruej, 25-27
Opiniones
No hay opiniones registradas para este curso