-
Tipo
Cursos
-
Modalidad
Presencial
-
Duración / Créditos
8 h.
-
Fechas
Matric. Permanente
-
Sedes
Barcelona/Madrid
Información general
DESCRIPCIÓN:
El actual curso, proporcionará al participante los fundamentos básicos de Apache Kudu, el cual es un sistema de almacenamiento en columnas desarrollado para ser usado en el ambiente Hadoop. Es un motor diseñado para el acceso aleatorio y de baja latencia de datos estructurados, permitiendo la gestión de grandes volúmenes de datos. También se desarrollarán aplicaciones Spark integradas con Kudu.
El curso tiene una duración de 8 horas, bajo la modalidad Online, está dirigido a profesionales de las áreas de desarrollo de software, análisis de datos, ingeniería de datos, análisis de datos y científicas. Es necesario para un mejor aprovechamiento de la capacitación, poseer conocimientos de programación en Python o Scala, así como también de SQL.
El curso tiene una duración de 8 horas, bajo la modalidad Online, está dirigido a profesionales de las áreas de desarrollo de software, análisis de datos, ingeniería de datos, análisis de datos y científicas. Es necesario para un mejor aprovechamiento de la capacitación, poseer conocimientos de programación en Python o Scala, así como también de SQL.
Titulación universitaria
Certificado de profesionalidad
ASPECTOS A TENER EN CUENTA
FINALIDAD DEL PROGRAMA FORMATIVO:
- Proveer conceptos fundamentales de Kudu.
- Comparar Kudu con otros sistemas de almacenamiento existentes e identificar los casos de uso donde aplicar Kudu.
- Comprender la arquitectura de Kudu y el diseño de las tablas para almacenar datos y obtener un máximo rendimiento.
- Aplicar técnicas de gestión de datos sobre los procesos de inserción, actualización o eliminación de registros de tablas Kudu con el uso del motor SQL Impala, así como también metodologías de carga masiva.
- Generar aplicaciones Apache Spark con Apache Kudu.
- Comparar Kudu con otros sistemas de almacenamiento existentes e identificar los casos de uso donde aplicar Kudu.
- Comprender la arquitectura de Kudu y el diseño de las tablas para almacenar datos y obtener un máximo rendimiento.
- Aplicar técnicas de gestión de datos sobre los procesos de inserción, actualización o eliminación de registros de tablas Kudu con el uso del motor SQL Impala, así como también metodologías de carga masiva.
- Generar aplicaciones Apache Spark con Apache Kudu.
¿A quién va dirigido?
Esta formación está diseñada para personas involucradas con el desarrollo del software y el análisis de datos, desarrolladores de software, ingenieros de datos, DBA, científicos de datos y analistas de datos.
Los estudiantes deben saber SQL.
Se recomienda cierta familiaridad con Impala, pero no es obligatorio.
Los estudiantes también deben saber cómo desarrollar aplicaciones Apache Spark utilizando Python o Scala.
Se espera experiencia básica de Linux.
Los estudiantes deben saber SQL.
Se recomienda cierta familiaridad con Impala, pero no es obligatorio.
Los estudiantes también deben saber cómo desarrollar aplicaciones Apache Spark utilizando Python o Scala.
Se espera experiencia básica de Linux.
TITULACIÓN
Curso Introduction to Apache Kudu
TEMARIO
CONTENIDOS
INTRODUCCIÓN
DESCRIPCIÓN GENERAL Y ARQUITECTURA
- ¿Qué es Kudu?
- ¿Por qué usar Kudu?
- Casos de uso de Kudu
- Descripción general de la arquitectura
- Herramientas Kudu
- Puntos esenciales
TABLAS APACHE KUDU
- Tablas Kudu
- Opciones de almacenamiento de datos
- Diseñando esquemas
- Tablas de particionamiento para un mejor rendimiento
- Uso de herramientas Kudu con tablas
- Puntos esenciales
USO DE APACHE KUDU CON APACHE IMPALA
- Descripción general de Apache Impala
- Creación y consulta de tablas
- Eliminar tablas
- Cargando y modificando datos en tablas Kudu
- Definición de la estrategia de particionamiento
- Puntos esenciales
DESARROLLO DE APLICACIONES APACHE SPARK CON APACHE KUDU
- Apache Spark y Apache Kudu
- Kudu, Spark SQL y DataFrames
- Gestión de datos de tablas Kudu con Scala
- Creación de tablas Kudu con Scala
- Puntos esenciales
CONCLUSIÓN
INTRODUCCIÓN
DESCRIPCIÓN GENERAL Y ARQUITECTURA
- ¿Qué es Kudu?
- ¿Por qué usar Kudu?
- Casos de uso de Kudu
- Descripción general de la arquitectura
- Herramientas Kudu
- Puntos esenciales
TABLAS APACHE KUDU
- Tablas Kudu
- Opciones de almacenamiento de datos
- Diseñando esquemas
- Tablas de particionamiento para un mejor rendimiento
- Uso de herramientas Kudu con tablas
- Puntos esenciales
USO DE APACHE KUDU CON APACHE IMPALA
- Descripción general de Apache Impala
- Creación y consulta de tablas
- Eliminar tablas
- Cargando y modificando datos en tablas Kudu
- Definición de la estrategia de particionamiento
- Puntos esenciales
DESARROLLO DE APLICACIONES APACHE SPARK CON APACHE KUDU
- Apache Spark y Apache Kudu
- Kudu, Spark SQL y DataFrames
- Gestión de datos de tablas Kudu con Scala
- Creación de tablas Kudu con Scala
- Puntos esenciales
CONCLUSIÓN
SALIDAS PROFESIONALES
Con esta formación podrás ejercer como profesional cualificado en puestos de trabajo de:
- Asesor de sistemas informáticos
- Programación
- Departamentos de informática
- Administración de sistemas y redes
- Administrador de sistemas operativos Linux
- Trabajar como experto en plataformas computacionales e informáticas
- Gestor de clústers Apache Hadoo
TE RECOMENDAMOS VER TAMBIÉN
En los siguientes enlaces podrás ver programas formativos similares:
UBICACIONES DE NUESTRAS SEDES
-
Barcelona
Avinguda Diagonal, 98-100 - Distrito 22
-
Madrid
c/ Arregui y Aruej, 25-27
Opiniones
No hay opiniones registradas para este curso