-
Tipo
Cursos
-
Modalidad
Online / A distancia (+)
-
Duración / Créditos
28 h.
-
Fechas
Matric. Permanente
-
Sedes
Barcelona/Madrid
Información general
DESCRIPCIÓN:
La presente capacitación, brindará a los participantes amplios conocimientos en las técnicas requeridas para gestionar y mantener clústers a través del uso de Cloudera Data Platform (CDP) en ambientes de producción y desarrollo, cubriendo aspectos que parten desde la instalación y configuración hasta el balanceo de carga y su desempeño óptimo.
Este curso se desarrollará en 28 horas y será impartido en modalidad Online o Live Virtual Class, está dirigido a profesionales IT con experiencia en el manejo del sistema operativo Linux, sin que sean necesarias competencias en la administración de Apache Hadoop.
Este curso se desarrollará en 28 horas y será impartido en modalidad Online o Live Virtual Class, está dirigido a profesionales IT con experiencia en el manejo del sistema operativo Linux, sin que sean necesarias competencias en la administración de Apache Hadoop.
Titulación universitaria
Certificado de profesionalidad
ASPECTOS A TENER EN CUENTA
FINALIDAD DEL PROGRAMA FORMATIVO:
- Identificar la topología estándar de un clúster de Cloudera y el rol que desempeñan los componentes primordiales en el clúster.
Instalar Cloudera Manager y CDP.
- Implementar Cloudera Manager para crear, configurar, implementar y monitorear un clúster.
- Definir herramientas suministradas por Cloudera para tomar datos de fuentes externas en un clúster.
- Configurar componentes del clúster para un rendimiento óptimo.
- Conocer e implementar labores rutinarias y necesarias para el mantenimiento de un clúster, incluyendo actualizaciones a nuevas versiones de CDP.
- Aprender sobre detección, resolución de conflictos y reparación de los mismos.
Conocer las funciones de seguridad clave de Cloudera.
Instalar Cloudera Manager y CDP.
- Implementar Cloudera Manager para crear, configurar, implementar y monitorear un clúster.
- Definir herramientas suministradas por Cloudera para tomar datos de fuentes externas en un clúster.
- Configurar componentes del clúster para un rendimiento óptimo.
- Conocer e implementar labores rutinarias y necesarias para el mantenimiento de un clúster, incluyendo actualizaciones a nuevas versiones de CDP.
- Aprender sobre detección, resolución de conflictos y reparación de los mismos.
Conocer las funciones de seguridad clave de Cloudera.
¿A quién va dirigido?
Este curso está enfocado para administradores de sistemas y gerentes IT que tengan experiencia básica en Linux.
TITULACIÓN
Curso Administrator Training: CDP Private Cloud Base
Requisitos
No se requieren conocimientos previos de Apache Hadoop.
TEMARIO
CONTENIDOS
MÓDULO 1: PLATAFORMA DE DATOS DE CLOUDERA
- Tendencias de la industria para Big Data
- El desafío de estar basado en datos
- La nube de datos empresariales
- Descripción general de CDP
- Factores de forma de CDP
- Ejercicio práctico: configurar la red de ejercicios
MÓDULO 2: INSTALACIÓN DE LA BASE DE NUBE PRIVADA DE CDP
- Descripción general de la instalación
- Instalación de Cloudera Manager
- Ejercicio práctico: instalación de Cloudera Manager Server
- Descripción general del tiempo de ejecución de CDP
- Introducción a Cloudera Manager
- Demostración dirigida por un instructor: Cloudera Manager
- Ejercicio práctico: instalación en clúster
MÓDULO 3: CONFIGURACIÓN DE CLÚSTER
- Visión general
- Ajustes de configuración
- Modificación de configuraciones de servicio
- Archivos de configuración
- Administrar instancias de roles
- Agregar nuevos servicios
- Agregar y quitar hosts
- Ejercicio práctico: configuración de un clúster de Hadoop
MÓDULO 4: ALMACENAMIENTO DE DATOS
- Visión general
- Topología y roles de HDFS
- Rendimiento de HDFS y tolerancia a fallos
- Descripción general de seguridad de HDFS y Hadoop
- Trabajar con la interfaz de usuario de Namenode
- Demostración dirigida por un instructor: interfaz de usuario de Namenode
- Trabajando con HDFS
- Ejercicio práctico: trabajar con HDFS
- Descripción general de HBase
- Descripción general de Kudu
- Descripción general de almacenamiento en la nube
- Ejercicio práctico: almacenamiento de datos en Amazon S3
MÓDULO 5: INGESTA DE DATOS
- Descripción general de la ingesta de datos
- Formatos de archivo
- Ingesta de datos mediante transferencia de archivos o interfaces REST
- Importación de datos de bases de datos relacionales con Apache Sqoop
- Ejercicio práctico: importación de datos con Sqoop
- Ingesta de datos con NiFi
- Demostración dirigida por un instructor: interfaz de usuario de NiFi
- Prácticas recomendadas para importar datos
- Ejercicio práctico: verificación de NiFi
MÓDULO 6: FLUJO DE DATOS
- Descripción general de Cloudera Flow Management y NiFi
- Arquitectura NiFi
- Gestión de flujo de Cloudera Edge y MiNiFi
- Demostración dirigida por un instructor: uso de NiFi
- Descripción general de Apache Kafka
- Arquitectura de clúster de Apache Kafka
- Herramientas de línea de comandos de Apache Kafka
- Ejercicio práctico: trabajar con Kafka
MÓDULO 7: ACCESO Y DESCUBRIMIENTO DE DATOS
- Apache Hive
- Apache Impala
- Ajuste de Apache Impala
- Ejercicio práctico: instalar Impala y Hue
- Resumen de búsqueda
- Descripción general de Hue
- Administrar y configurar Hue
- Autenticación y autorización de Hue
- Descripción general de CDSW
- Ejercicio práctico: uso de Hue, Hive e Impala
MÓDULO 8: COMPUTACIÓN DE DATOS
- Descripción general de YARN
- Ejecución de aplicaciones en YARN
- Visualización de aplicaciones de YARN
- Registros de aplicaciones de YARN
- Aplicaciones MapReduce
- Configuración de CPU y memoria YARN
- Ejercicio práctico: ejecución de aplicaciones YARN
- Descripción general de Tez
- ACID para Hive
- Descripción general de Spark
- Cómo se ejecutan las aplicaciones Spark en YARN
- Supervisión de aplicaciones Spark
- Ejercicio práctico: ejecución de aplicaciones Spark
MÓDULO 9: GESTIÓN DE RECURSOS
- Descripción general de la gestión de recursos
- Etiquetas de nodo
- Configuración de cgroups
- El programador de capacidad
- Administrar colas
- Programación de consultas de Impala
- Ejercicio práctico: uso del programador de capacidad
MÓDULO 10: PLANIFICACIÓN DE SU CLÚSTER
- Consideraciones generales de planificación
- Elegir el hardware adecuado
- Consideraciones de red
- Consideraciones sobre la nube privada de CDP
- Configurar nodos
MÓDULO 11: CONFIGURACIÓN AVANZADA DE CLÚSTERES
- Configuración de puertos de servicio
- Ajuste de HDFS y MapReduce
- Gestionar el crecimiento del clúster
- Codificación de borrado
- Habilitación de alta disponibilidad para HDFS y YARN
- Ejercicio práctico: configuración de HDFS para alta disponibilidad
MÓDULO 12: MANTENIMIENTO DE CLÚSTERES
- Comprobación del estado de HDFS
- Copiar datos entre clústeres
- Reequilibrio de datos en HDFS
- Instantáneas del directorio HDFS
- Ejercicio práctico: creación y uso de una instantánea
- Mantenimiento de host
- Actualizar un clúster
- Ejercicio práctico: actualizar el clúster
MÓDULO 13: MONITOREO DE CLÚSTERES
- Funciones de supervisión de Cloudera Manager
- Pruebas de salud
- Ejercicio práctico: Romper el grupo
- Eventos y alertas
- Gráficos e informes
- Recomendaciones de seguimiento
- Ejercicio práctico: confirmación de la reparación del clúster y configuración de alertas por correo electrónico
MÓDULO 14: SOLUCIÓN DE PROBLEMAS DEL CLÚSTER
- Visión general
- Herramientas de resolución de problemas
- Ejemplos de configuración incorrecta
- Ejercicio práctico: resolución de problemas de un clúster
MÓDULO 15: SEGURIDAD
- Gobierno de datos con SDX
- Conceptos de seguridad de Hadoop
- Autenticación de Hadoop mediante Kerberos
- Autorización de Hadoop
- Cifrado Hadoop
- Asegurar un clúster de Hadoop
- Apache Ranger
- Atlas de Apache
- Copia de seguridad y recuperación
MÓDULO 16: NUBE PRIVADA / NUBE PÚBLICA
- Descripción general de CDP
- Capacidades de nube privada
- Capacidades de nube pública
- ¿Qué es Kubernetes?
- Descripción general de Workload XM
- Escalado automático
MÓDULO 17: CONCLUSIÓN
MÓDULO 18: APÉNDICE: API DE CLOUDERA MANAGER
- API de Cloudera Manager
- Instalación y configuración
- Ejemplos de código
MÓDULO 19: APÉNDICE: DESCRIPCIÓN GENERAL DE OZONE
- Descripción general de Ozone
- Trabajar con Ozone
MÓDULO 1: PLATAFORMA DE DATOS DE CLOUDERA
- Tendencias de la industria para Big Data
- El desafío de estar basado en datos
- La nube de datos empresariales
- Descripción general de CDP
- Factores de forma de CDP
- Ejercicio práctico: configurar la red de ejercicios
MÓDULO 2: INSTALACIÓN DE LA BASE DE NUBE PRIVADA DE CDP
- Descripción general de la instalación
- Instalación de Cloudera Manager
- Ejercicio práctico: instalación de Cloudera Manager Server
- Descripción general del tiempo de ejecución de CDP
- Introducción a Cloudera Manager
- Demostración dirigida por un instructor: Cloudera Manager
- Ejercicio práctico: instalación en clúster
MÓDULO 3: CONFIGURACIÓN DE CLÚSTER
- Visión general
- Ajustes de configuración
- Modificación de configuraciones de servicio
- Archivos de configuración
- Administrar instancias de roles
- Agregar nuevos servicios
- Agregar y quitar hosts
- Ejercicio práctico: configuración de un clúster de Hadoop
MÓDULO 4: ALMACENAMIENTO DE DATOS
- Visión general
- Topología y roles de HDFS
- Rendimiento de HDFS y tolerancia a fallos
- Descripción general de seguridad de HDFS y Hadoop
- Trabajar con la interfaz de usuario de Namenode
- Demostración dirigida por un instructor: interfaz de usuario de Namenode
- Trabajando con HDFS
- Ejercicio práctico: trabajar con HDFS
- Descripción general de HBase
- Descripción general de Kudu
- Descripción general de almacenamiento en la nube
- Ejercicio práctico: almacenamiento de datos en Amazon S3
MÓDULO 5: INGESTA DE DATOS
- Descripción general de la ingesta de datos
- Formatos de archivo
- Ingesta de datos mediante transferencia de archivos o interfaces REST
- Importación de datos de bases de datos relacionales con Apache Sqoop
- Ejercicio práctico: importación de datos con Sqoop
- Ingesta de datos con NiFi
- Demostración dirigida por un instructor: interfaz de usuario de NiFi
- Prácticas recomendadas para importar datos
- Ejercicio práctico: verificación de NiFi
MÓDULO 6: FLUJO DE DATOS
- Descripción general de Cloudera Flow Management y NiFi
- Arquitectura NiFi
- Gestión de flujo de Cloudera Edge y MiNiFi
- Demostración dirigida por un instructor: uso de NiFi
- Descripción general de Apache Kafka
- Arquitectura de clúster de Apache Kafka
- Herramientas de línea de comandos de Apache Kafka
- Ejercicio práctico: trabajar con Kafka
MÓDULO 7: ACCESO Y DESCUBRIMIENTO DE DATOS
- Apache Hive
- Apache Impala
- Ajuste de Apache Impala
- Ejercicio práctico: instalar Impala y Hue
- Resumen de búsqueda
- Descripción general de Hue
- Administrar y configurar Hue
- Autenticación y autorización de Hue
- Descripción general de CDSW
- Ejercicio práctico: uso de Hue, Hive e Impala
MÓDULO 8: COMPUTACIÓN DE DATOS
- Descripción general de YARN
- Ejecución de aplicaciones en YARN
- Visualización de aplicaciones de YARN
- Registros de aplicaciones de YARN
- Aplicaciones MapReduce
- Configuración de CPU y memoria YARN
- Ejercicio práctico: ejecución de aplicaciones YARN
- Descripción general de Tez
- ACID para Hive
- Descripción general de Spark
- Cómo se ejecutan las aplicaciones Spark en YARN
- Supervisión de aplicaciones Spark
- Ejercicio práctico: ejecución de aplicaciones Spark
MÓDULO 9: GESTIÓN DE RECURSOS
- Descripción general de la gestión de recursos
- Etiquetas de nodo
- Configuración de cgroups
- El programador de capacidad
- Administrar colas
- Programación de consultas de Impala
- Ejercicio práctico: uso del programador de capacidad
MÓDULO 10: PLANIFICACIÓN DE SU CLÚSTER
- Consideraciones generales de planificación
- Elegir el hardware adecuado
- Consideraciones de red
- Consideraciones sobre la nube privada de CDP
- Configurar nodos
MÓDULO 11: CONFIGURACIÓN AVANZADA DE CLÚSTERES
- Configuración de puertos de servicio
- Ajuste de HDFS y MapReduce
- Gestionar el crecimiento del clúster
- Codificación de borrado
- Habilitación de alta disponibilidad para HDFS y YARN
- Ejercicio práctico: configuración de HDFS para alta disponibilidad
MÓDULO 12: MANTENIMIENTO DE CLÚSTERES
- Comprobación del estado de HDFS
- Copiar datos entre clústeres
- Reequilibrio de datos en HDFS
- Instantáneas del directorio HDFS
- Ejercicio práctico: creación y uso de una instantánea
- Mantenimiento de host
- Actualizar un clúster
- Ejercicio práctico: actualizar el clúster
MÓDULO 13: MONITOREO DE CLÚSTERES
- Funciones de supervisión de Cloudera Manager
- Pruebas de salud
- Ejercicio práctico: Romper el grupo
- Eventos y alertas
- Gráficos e informes
- Recomendaciones de seguimiento
- Ejercicio práctico: confirmación de la reparación del clúster y configuración de alertas por correo electrónico
MÓDULO 14: SOLUCIÓN DE PROBLEMAS DEL CLÚSTER
- Visión general
- Herramientas de resolución de problemas
- Ejemplos de configuración incorrecta
- Ejercicio práctico: resolución de problemas de un clúster
MÓDULO 15: SEGURIDAD
- Gobierno de datos con SDX
- Conceptos de seguridad de Hadoop
- Autenticación de Hadoop mediante Kerberos
- Autorización de Hadoop
- Cifrado Hadoop
- Asegurar un clúster de Hadoop
- Apache Ranger
- Atlas de Apache
- Copia de seguridad y recuperación
MÓDULO 16: NUBE PRIVADA / NUBE PÚBLICA
- Descripción general de CDP
- Capacidades de nube privada
- Capacidades de nube pública
- ¿Qué es Kubernetes?
- Descripción general de Workload XM
- Escalado automático
MÓDULO 17: CONCLUSIÓN
MÓDULO 18: APÉNDICE: API DE CLOUDERA MANAGER
- API de Cloudera Manager
- Instalación y configuración
- Ejemplos de código
MÓDULO 19: APÉNDICE: DESCRIPCIÓN GENERAL DE OZONE
- Descripción general de Ozone
- Trabajar con Ozone
SALIDAS PROFESIONALES
Con esta formación podrás ejercer como profesional cualificado en puestos de trabajo de:
- Asesor de sistemas informáticos
- Programación
- Departamentos de informática
- Administración de sistemas y redes
- Administrador de sistemas operativos Linux
- Trabajar como experto en plataformas computacionales e informáticas
- Gestor de clústers Apache Hadoo
TE RECOMENDAMOS VER TAMBIÉN
En los siguientes enlaces podrás ver programas formativos similares:
UBICACIONES DE NUESTRAS SEDES
-
Barcelona
Avinguda Diagonal, 98-100 - Distrito 22
-
Madrid
c/ Arregui y Aruej, 25-27
Opiniones
No hay opiniones registradas para este curso