-
Tipo
Cursos
-
Modalidad
Online / A distancia (+)
-
Duración / Créditos
28 h.
-
Fechas
Matric. Permanente
-
Sedes
Barcelona/Madrid
Información general
DESCRIPCIÓN:
El presente curso, dotará a los participantes con amplios conocimientos sobre las técnicas necesarias para trabajar en el entorno de desarrollo de software Hadoop bajo licencia libre, utilizado para la codificación de aplicaciones que gestionan grandes volúmenes de datos por el orden de los petabytes, a través de clústers distribuidos en red operando concurrentemente.
Este curso se desarrollará en 28 horas lectivas y será impartido en formato Online o Live Virtual Class, está dirigido a profesionales que se desenvuelvan en la administración de Sistemas y al personal responsable de la gestión de clústers Apache Hadoop en ambientes de Producción o Desarrollo.
Este curso se desarrollará en 28 horas lectivas y será impartido en formato Online o Live Virtual Class, está dirigido a profesionales que se desenvuelvan en la administración de Sistemas y al personal responsable de la gestión de clústers Apache Hadoop en ambientes de Producción o Desarrollo.
Titulación universitaria
Certificado de profesionalidad
ASPECTOS A TENER EN CUENTA
FINALIDAD DEL PROGRAMA FORMATIVO:
- Identificar la topología estándar del clúster de Cloudera y la función a desempeñar de los más importantes componentes de CDH en el clúster.
- Añadir Cloudera Manager y CDH.
- Utilizar Cloudera Manager con la finalidad de crear, configurar, implementar y monitorizar un clúster CDH.
- Implementar las herramientas proporcionadas por Cloudera para el ingreso de datos de origen externo en un clúster.
- Optimizar los componentes del clúster para obtener su máxima utilidad.
- Aprender sobre las tareas rutinarias y necesarias para el mantenimiento óptimo de un clúster, incluyendo actualizaciones a nuevas versiones de CDH.
- Manejar la localización, solución y reparación de conflictos.
- Aplicar las funciones de seguridad Key Cloudera.
- Añadir Cloudera Manager y CDH.
- Utilizar Cloudera Manager con la finalidad de crear, configurar, implementar y monitorizar un clúster CDH.
- Implementar las herramientas proporcionadas por Cloudera para el ingreso de datos de origen externo en un clúster.
- Optimizar los componentes del clúster para obtener su máxima utilidad.
- Aprender sobre las tareas rutinarias y necesarias para el mantenimiento óptimo de un clúster, incluyendo actualizaciones a nuevas versiones de CDH.
- Manejar la localización, solución y reparación de conflictos.
- Aplicar las funciones de seguridad Key Cloudera.
¿A quién va dirigido?
Este curso oficial se dirige a Administradores de Sistemas y a todo personal que sea responsable de la gestión de clústers Apache Hadoop en entornos de Producción o Desarrollo.
TITULACIÓN
Curso Cloudera Administrator Training for Apache Hadoop
Requisitos
No es necesario tener un conocimiento previo de Hadoop.
TEMARIO
CONTENIDOS
INTRODUCCIÓN
Cloudera Enterprise Data Hub
- Cloudera Enterprise Data Hub
- Descripción general de CDH
- Descripción general de Cloudera Manager
- Responsabilidades del administrador de Hadoop
INSTALACIÓN DE CLOUDERA MANAGER Y CDH
- Descripción general de la instalación de un Clúster
- Instalación de Cloudera Manager
- Instalación de CDH
- CDH Cluster Services
CONFIGURACIÓN DE UN CLÚSTER DE CLOUDERA
- Descripción general
- Ajustes de configuración
- Modificación de configuraciones de servicio
- Ficheros de configuración
- Administración de Role Instances
- Agregar nuevos servicios
- Agregar y quitar hosts
HADOOP DISTRIBUTED FILE SYSTEM
- Descripción general
- Topología de HDFS y roles
- Editar logs y puntos de control
- Rendimiento de HDFS y tolerancia a fallos
- Descripción general de seguridad HDFS y Hadoop
- Interfaces de usuario web para HDFS
- Uso de la interfaz de línea de comandos HDFS
- Otras utilidades de línea de comandos
INGESTA DE DATOS CON HDFS
- Información general de ingesta de datos
- Formatos de ficheros
- Ingesta de datos mediante transferencia de archivos o interfaces REST
- Importación de datos de bases de datos relacionales con Apache Sqoop
- Ingesta de datos de fuentes externas con Apache Flume
- Mejores prácticas para la importación de datos
HIVE E IMPALA
- Apache Hive
- Apache Impala
YARN Y MAPREDUCE
- Descripción general de YARN
- Ejecución de aplicaciones en YARN
- Visualización de aplicaciones en YARN
- Logs de aplicaciones en YARN
- Aplicaciones de MapReduce
- Configuración de memoria y CPU de YARN
APACHE SPARK
- Descripción general de Spark
- Aplicaciones Spark
- Ejecución las aplicaciones Spark en YARN
- Monitorización de aplicaciones Spark
PLANIFICACIÓN DE SU CLÚSTER
- Consideraciones generales de planificación
- Elegir el hardware adecuado
- Consideraciones de red
- Opciones de virtualización
- Opciones de implementación Cloud
- Configuración de nodos
CONFIGURACIÓN AVANZADA DEL CLUSTER
- Configuración de puertos de servicio
- ModificarHDFS y MapReduce
- Habilitar alta disponibilidad en HDFS
GESTIÓN DE RECURSOS
- Configuración de cgroups con Static Service Pools
- El Fair Scheduler
- Configuración de Dynamic Resource Pools
- Programación de consultas en Impala
MANTENIMIENTO DE UN CLÚSTER
- Comprobación del estado de HDFS
- Copia de datos entre Clústeres
- Rebalanceo de datos en HDFS
- HDFS Directory Snapshots
- Actualización de un clúster
MONITORIZACIÓN DE CLÚSTERES
- Funciones de monitorización de Cloudera Manager
- Pruebas de salud
- Eventos y alertas
- Gráficos e informes
- Recomendaciones de monitorización
RESOLUCIÓN DE PROBLEMAS DE UN CLÚSTER
- Descripción general
- Herramientas de resolución de problemas
- Ejemplos de mala configuración
INSTALACIÓN Y GESTIÓN DE HUE
- Descripción general
- Administración y configuración de Hue
- Autenticación y autorización en Hue
SEGURIDAD
- Conceptos de seguridad en Hadoop
- Autenticación en Hadoop mediante Kerberos
- Autorización en Hadoop
- Cifrado en Hadoop
- Securización de un clúster de Hadoop
APACHE KUDU
- Descripción general de Kudu
- Arquitectura
- Instalación y configuración
- Herramientas de monitorización y administración
APACHE KAFKA
- ¿Qué es Apache Kafka?
- Descripción general de Apache Kafka
- Arquitectura de un Clúster Apache Kafka
- Herramientas de línea de comandos Apache Kafka
- Uso de Kafka con Flume
ALMACENAMIENTO DE OBJETOS CLOUD
- Almacenamiento de objetos
- Conexión de Hadoop con el almacenamiento de objetos
INTRODUCCIÓN
Cloudera Enterprise Data Hub
- Cloudera Enterprise Data Hub
- Descripción general de CDH
- Descripción general de Cloudera Manager
- Responsabilidades del administrador de Hadoop
INSTALACIÓN DE CLOUDERA MANAGER Y CDH
- Descripción general de la instalación de un Clúster
- Instalación de Cloudera Manager
- Instalación de CDH
- CDH Cluster Services
CONFIGURACIÓN DE UN CLÚSTER DE CLOUDERA
- Descripción general
- Ajustes de configuración
- Modificación de configuraciones de servicio
- Ficheros de configuración
- Administración de Role Instances
- Agregar nuevos servicios
- Agregar y quitar hosts
HADOOP DISTRIBUTED FILE SYSTEM
- Descripción general
- Topología de HDFS y roles
- Editar logs y puntos de control
- Rendimiento de HDFS y tolerancia a fallos
- Descripción general de seguridad HDFS y Hadoop
- Interfaces de usuario web para HDFS
- Uso de la interfaz de línea de comandos HDFS
- Otras utilidades de línea de comandos
INGESTA DE DATOS CON HDFS
- Información general de ingesta de datos
- Formatos de ficheros
- Ingesta de datos mediante transferencia de archivos o interfaces REST
- Importación de datos de bases de datos relacionales con Apache Sqoop
- Ingesta de datos de fuentes externas con Apache Flume
- Mejores prácticas para la importación de datos
HIVE E IMPALA
- Apache Hive
- Apache Impala
YARN Y MAPREDUCE
- Descripción general de YARN
- Ejecución de aplicaciones en YARN
- Visualización de aplicaciones en YARN
- Logs de aplicaciones en YARN
- Aplicaciones de MapReduce
- Configuración de memoria y CPU de YARN
APACHE SPARK
- Descripción general de Spark
- Aplicaciones Spark
- Ejecución las aplicaciones Spark en YARN
- Monitorización de aplicaciones Spark
PLANIFICACIÓN DE SU CLÚSTER
- Consideraciones generales de planificación
- Elegir el hardware adecuado
- Consideraciones de red
- Opciones de virtualización
- Opciones de implementación Cloud
- Configuración de nodos
CONFIGURACIÓN AVANZADA DEL CLUSTER
- Configuración de puertos de servicio
- ModificarHDFS y MapReduce
- Habilitar alta disponibilidad en HDFS
GESTIÓN DE RECURSOS
- Configuración de cgroups con Static Service Pools
- El Fair Scheduler
- Configuración de Dynamic Resource Pools
- Programación de consultas en Impala
MANTENIMIENTO DE UN CLÚSTER
- Comprobación del estado de HDFS
- Copia de datos entre Clústeres
- Rebalanceo de datos en HDFS
- HDFS Directory Snapshots
- Actualización de un clúster
MONITORIZACIÓN DE CLÚSTERES
- Funciones de monitorización de Cloudera Manager
- Pruebas de salud
- Eventos y alertas
- Gráficos e informes
- Recomendaciones de monitorización
RESOLUCIÓN DE PROBLEMAS DE UN CLÚSTER
- Descripción general
- Herramientas de resolución de problemas
- Ejemplos de mala configuración
INSTALACIÓN Y GESTIÓN DE HUE
- Descripción general
- Administración y configuración de Hue
- Autenticación y autorización en Hue
SEGURIDAD
- Conceptos de seguridad en Hadoop
- Autenticación en Hadoop mediante Kerberos
- Autorización en Hadoop
- Cifrado en Hadoop
- Securización de un clúster de Hadoop
APACHE KUDU
- Descripción general de Kudu
- Arquitectura
- Instalación y configuración
- Herramientas de monitorización y administración
APACHE KAFKA
- ¿Qué es Apache Kafka?
- Descripción general de Apache Kafka
- Arquitectura de un Clúster Apache Kafka
- Herramientas de línea de comandos Apache Kafka
- Uso de Kafka con Flume
ALMACENAMIENTO DE OBJETOS CLOUD
- Almacenamiento de objetos
- Conexión de Hadoop con el almacenamiento de objetos
SALIDAS PROFESIONALES
Con esta formación podrás ejercer como profesional cualificado en puestos de trabajo de:
- Asesor de sistemas informáticos
- Programación
- Departamentos de informática
- Administración de sistemas y redes
- Administrador de sistemas operativos Linux
- Trabajar como experto en plataformas computacionales e informáticas
- Gestor de clústers Apache Hadoo
TE RECOMENDAMOS VER TAMBIÉN
En los siguientes enlaces podrás ver programas formativos similares:
UBICACIONES DE NUESTRAS SEDES
-
Barcelona
Avinguda Diagonal, 98-100 - Distrito 22
-
Madrid
c/ Arregui y Aruej, 25-27
Opiniones
No hay opiniones registradas para este curso