docenzia
¡ME INTERESA!

Curso Cloudera Data Analyst Training - Pue

Centro de formación

Pue

0,0

0 opiniones /
Curso Cloudera Data Analyst Training - Pue
Precio
1.670 €
Tipo Cursos
Modalidad Online / A distancia, Presencial
En Docenzia te asesoramos de forma gratuita para que escojas el mejor programa formativo que se adapte a tus necesidades y así poder mejorar tu carrera profesional. ¡Contáctanos para ayudarte!

Recibir más información

¿Cuándo contactamos contigo?


Enviando...

Curso Cloudera Data Analyst Training - Pue

Información general

DESCRIPCIÓN:

A través del curso de Cloudera Data Analyst Training aprenderás a aplicar análisis de datos tradicionales y obtendrás la habilidad de gestionar las herramientas de inteligencia de negocio para el big data, logrando ser un profesional destacado e indispensable en toda área a la que te dediques, además, contarás con una serie de herramientas necesarias para manipular y analizar conjuntos de datos complejos utilizando SQL.

Cabe destacar que dicho curso ofrece un amplio contenido formativo de calidad, el cual será organizado por los mejores docentes del sector, los cuales asegurarán una formación de calidad.

ASPECTOS A TENER EN CUENTA

OBJETIVOS DEL CURSO:

Lograr la comprensión detallada de las funciones analíticas y las funciones de ventana y uso de ambas.
Capacitar a cada usuario para trabajar de manera exitosa en el análisis de datos tradicionales.
Obtener la habilidad de gestionar las herramientas de inteligencia de negocio para el big data.
Dirigirse a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, y administradores de bases de datos, garantizando así su éxito y desarrollo profesional.

¿A quién va dirigido?

Curso dirigido a analistas de datos, especialistas en inteligencia de negocio, desarrolladores, arquitectos de sistemas y administradores de bases de datos. Se requieren conocimientos de SQL y estar familiarizado con comandos de Linux. Aunque no es obligatorio, se recomienda el manejo de algún lenguaje de scripting (Bash scripting, Perl, Python, Ruby). No son necesarios conocimientos de Hadoop.

TITULACIÓN

Cloudera Data Analyst Training

TEMARIO

CONTENIDOS
INTRODUCCIÓN
FUNDAMENTOS HADOOP

- ¿Por qué Hadoop?
- Aspectos generales de Hadoop
- Almacenamiento de datos: HDFS
- Procesamiento de datos distribuidos: YARN, MapReduce, y Spark
- Procesamiento y análisis de datos: Hive, e Impala
- Integración de datos: Sqoop
- Otras herramientas de datos de Hadoop
- Explicación del escenario con ejercicios
INTRODUCCIÓN A HIVE E IMPALA
- ¿Qué es Hive?
- ¿Qué es Impala?
- ¿Por qué utilizar Hive e Impala?
- Schema y almacenamiento de datos
- Comparación entre Hive y bases de datos tradicionales
- Casos de uso
CONSULTAS CON HIVE E IMPALA
- Tablas y bases de datos
- Sintaxis básica en consultas Hive e Impala
- Tipos de datos
- Empleo de Hue para ejecutar consultas
- Empleo de Beeline (la Shell de Hive)
- Empleo de la Shell de Impala
OPERADORES COMUNES Y FUNCIONES INTEGRADAS
- Operadores
- Funciones escalares
- Funciones de agregación
ADMINISTRACIÓN DE DATOS
- Almacenamiento de datos
- Creación de bases de datos y tablas
- Carga de datos
- Alteración de bases de datos y tablas
- Simplificación de consultas con vistas
- Almacenamiento de resultados de consultas
ALMACENAMIENTO DE DATOS Y RENDIMIENTO
- Partición de tablas
- Carga de datos en tablas particionadas
- Cuándo utilizar el particionamiento
- Elección del formato de archivo
- Uso de los formatos de archivo Avro y Parquet
TRABAJANDO CON MÚLTIPLES DATASETS
- UNION y Joins
- Manejo de valores NULL en Joins
- Joins avanzados
FUNCIONES ANALÍTICAS Y FUNCIONES DE VENTANA
- Utilización de funciones analíticas comunes
- Otras funciones analíticas
- Ventanas deslizantes
DATOS COMPLEJOS
- Datos complejos con Hive
- Datos complejos con Impala
ANÁLISIS DE TEXTO
- Empleo de expresiones regulares
- Procesamiento de texto con SerDes en Hive
- Análisis de Sentiment y n-grams
OPTIMIZACIÓN HIVE
- Rendimiento de las consultas
- Bucketing
- Indexación de datos
- Hive en Spark
OPTIMIZACIÓN DE IMPALA
- Ejecución de consultas
- Mejorar el rendimiento de Impala
EXTENDIENDO HIVE E IMPALA
- Customizar SerDes y formatos de archivo en Hive
- Transformación de datos con Scripts personalizados en Hive
- Funciones definidas por el usuario
- Consultas parametrizadas
ELECCIÓN DE LA MEJOR OPCIÓN
- Comparación entre MapReduce, Hive, Impala, y bases de datos relacionales
- ¿Cuál elegir?
CONCLUSIÓN
APACHE KUDU

- ¿Qué es Kudu?
- Tablas Kudu
- Uso de Impala con Kudu

SALIDAS PROFESIONALES

  • - Data Scientist.
  • - Arquitecto de soluciones Big Data
  • - Administrador y/o desarrollador de sistemas Big Data
  • - Chief Data Officer (CDO).
  • - Machine Learning Engineer.
  • - Business Analyst.
  • - Big Data Consultant.
  • - Analista de datos (Data Analyst)
  • - Big Data Developer.
  • - Big Data Engineer.
  • - Data Analyst.
  • - NLP Consultant.

TE RECOMENDAMOS VER TAMBIÉN

En los siguientes enlaces podrás ver programas formativos similares:

UBICACIONES DE NUESTRAS SEDES

Opiniones

No hay opiniones registradas para este curso