-
Tipo
Cursos
-
Modalidad
Online / A distancia
-
Duración / Créditos
300 h.
-
Fechas
Matric. Permanente
Información general
DESCRIPCIÓN:
El Curso de Big Data: arquitectura y análisis de datos es un completo plan de estudios, que se especializa en formar profesionales en el campo de los cuadros de mando, la definición de componentes y arquitectura, las estrategias basadas en datos, los derechos sobre los datos, y el ciclo de vida del dato.
Consiste en un interesante método de aprendizaje, ofrecido y desarrollado por el prestigioso y conocido Centro Educativo Tokio School, el cual te brinda orientación laboral, no posee fecha de inicio ni de fin, y solamente se encuentra disponible en modalidad online.
Consiste en un interesante método de aprendizaje, ofrecido y desarrollado por el prestigioso y conocido Centro Educativo Tokio School, el cual te brinda orientación laboral, no posee fecha de inicio ni de fin, y solamente se encuentra disponible en modalidad online.
Titulación universitaria
Prácticas
Certificado de profesionalidad
ASPECTOS A TENER EN CUENTA
FINALIDAD DEL PROGRAMA FORMATIVO:
- Otorgar conocimientos acerca del almacenamiento de datos, la selección de elementos visuales, la toma de decisiones, las bases de datos no estructuradas, el Internet de las Cosas, y las bases de datos de grafos.
- Transmitir un excelente programa formativo, en el cual se profundiza sobre las herramientas del ecosistema Hadoop, el análisis de datos con Hive y Pig, el procesamiento de datos con Spark, y las técnicas de muestreo de datos.
- Conocer a detalle el testeo de hipótesis, la exploración de datos categóricos y binarios, los principios de la estadística descriptiva, y las redes neuronales.
- Transmitir un excelente programa formativo, en el cual se profundiza sobre las herramientas del ecosistema Hadoop, el análisis de datos con Hive y Pig, el procesamiento de datos con Spark, y las técnicas de muestreo de datos.
- Conocer a detalle el testeo de hipótesis, la exploración de datos categóricos y binarios, los principios de la estadística descriptiva, y las redes neuronales.
TITULACIÓN
Curso de Big Data
Diploma del idioma elegido
Certificación de Data Science de la mano de IBM
Diploma del idioma elegido
Certificación de Data Science de la mano de IBM
TEMARIO
MÓDULO 1: INTRODUCCIÓN AL BIG DATA
ECOSISTEMA BIG DATA
- Definición de componentes y arquitectura
- Disponibilidad, Escalabilidad y Resiliencia
- Introducción a Hadoop y MapReduce
ESTRATEGIAS BASADAS EN DATOS
- Cuadros de Mando (Dashboards)
- Business Intelligence vs Big Data
ENTORNOS DE PROCESAMIENTO
- Cloud Computing
- Internet de las Cosas (IoT)
- Casos de uso de Big Data: ejemplos en la industria
MÓDULO 2: EL DATO Y SU CICLO DE VIDA
DATOS
- El Dato
- Calidad del dato
- Derechos sobre los datos
CICLO DE VIDA DEL DATO
- Fuentes de datos
- Adquisición de datos
- Tratamiento, Carga y procesamiento
- Almacenamiento de datos
- Análisis para la explotación
- Visualización y Storytelling para la explotación
- La selección de los elementos visuales
- Toma de decisiones
MÓDULO 3: ALMACENAMIENTO ESCALABLE DE DATOS
SISTEMAS DISTRIBUIDOS (HADOOP)
BASES DE DATOS NO ESTRUCTURADAS (MONGODB)
BASES DE DATOS DE GRAFOS (NEO4J O SPARK GRAPH X)
MÓDULO 4: ARQUITECTURA BIG DATA
EL ECOSISTEMA HADOOP
- Introducción a Hadoop
- Herramientas del ecosistema Hadoop
CLUSTER Y SISTEMAS DISTRIBUIDOS (HDFS, MAPREDUCE)
ANÁLISIS DE DATOS CON HIVE Y PIG
PROCESAMIENTO DE DATOS CON SPARK
- Spark RDD (Resilient Distributed Datsets)
- Spark Streaming
- Spark SQL
MÓDULO 5: ANÁLISIS PARA LA EXPORTACIÓN DE DATO
PERFILES DE DATOS
- Científicos de datos
- Ingeniero de datos
ANÁLISIS EXPLORATORIO DE DATOS
- Estadística descriptiva
- Distribución de los datos
- Exploración de datos categóricos y binarios
- Correlación
- Exploración de 2 o más variables
TÉCNICAS DE MUESTREO DE DATOS
- Selección aleatoria
- Selección Bias
- Selección por distribución estadística
CONTRASTE DE HIPÓTESIS
- Testeo de muestras A/B
- Testeo de hipótesis
- Significancia estadística y P-value
- P-VALUE
REGRESIÓN Y PREDICCIÓN
- Regresión Linear
- Regresión Multilineal
- Interpretar los resultados de una regresión
- Predecir usando regresión
APRENDIZAJE SUPERVISADO
- Conceptos
- Algoritmos: Arboles de decisión
APRENDIZAJE NO SUPERVISADO
- Componentes principales
- Algoritmos: K-Means, Clusters Jerárquicos
INTRODUCCIÓN AL DEEP LEARNING
- Conceptos fundamentales
- Redes Neuronales
MÓDULO 6: PRESENTACIÓN PROYECTOS BIG DATA Y STORYTELLING
PRESENTACIÓN DE UN PROYECTO BIG DATA
- La importancia del contexto
- La audiencia y su importancia
COMPONENTES PARA LA PRESENTACIÓN DE UN PROYECTO BIG DATA
- Ideas de diseño
APACHE HADOOP
MÓDULO 1. INTRODUCCIÓN AL BIG DATA
CONCEPTOS BÁSICOS
- Definición y conceptos
- Evolución de los datos
SQL VS NOSQL
PREPARACIÓN ENTORNO DE TRABAJO
MÓDULO 2. APACHE HADOOP (HDFS)
CONCEPTOS BÁSICOS Y ARQUITECTURA
- Conceptos fundamentales
- Arquitectura Hadoop
LECTURA, ESCRITURA Y REPLICACIÓN
PERMISOS Y BORRADO DE DATOS
SAFEMODE, SNAPSHOTS Y GESTIÓN DE CACHÉ
PROFUNDIZANDO CON LA SHELL
MÓDULO 3. MAP REDUCE & YARN
MAP REDUCE: EL ALGORITMO
- Arquitectura
- Configuración
IMPLEMENTACIÓN DE ALGORITMOS MAP REDUCE
MANERAS DE EJECUTAR EL ALGORITMO
YARN: ARQUITECTURA, GESTIÓN DE COLAS Y ZOOKEEPER
MÓDULO 4. ECOSISTEMA HADOOP
APACHE HIVE
- Arquitectura
- Componentes
APACHE SQOOP
- Arquitectura
- Componentes
APACHE PIG
- Arquitectura
- Componentes
- Pig Latin
APACHE SPARK
- Arquitectura
- Componentes
- Tipos de datos
- Integración con Hive
REPORTING CON ZEPPELIN
- La importancia del reporting
- Creación de reportes con Zeppelin
BUSINESS INTELLIGENCE
MÓDULO 1. INTRODUCCIÓN AL BI
HISTORIA Y EVOLUCIÓN DEL BI
- ¿Qué es el BI?
- Componentes BI.
- Fuentes de información
CONCEPTOS BÁSICOS BI.
- Herramientas/procesos básicos BI.
MODELADO DE DATOS
- Modelo en estrella
- Modelo copo de nieve
- Modelo multidimensional
APROVISIONAMIENTO DE DATOS
- Datawarehouse
- Datamart
- Principales diferencias
MÓDULO 2. ETL E INTRODUCCIÓN A LA VISUALIZACIÓN
PROCESOS DE EXTRACCIÓN TRANSFORMACIÓN Y CARGAS Y HERRAMIENTAS
- Diseño de proceso ETL.
- Principales herramientas del mercado y particularidades
INTRODUCCIÓN A LA VISUALIZACIÓN
- Introducción a la visualización de la información
- Beneficios de la visualización
- Categorías de la visualización
HERRAMIENTAS Y PARTICULARIDADES
- Principales herramientas del mercado y comparativa
MÓDULO 3. INTRODUCCIÓN AL POWER BI
COMPRENSIÓN BÁSICA DE POWERBI
- ¿Qué es?
- ¿Para qué sirve?
- Interfaz
CONEXIÓN A ORÍGENES DE DATOS
EDITOR POWER QUERY
- Formateo de datos
- Detección de errores
- Pivot
CREACIÓN DE GRÁFICOS
CONSTRUCCIÓN DE INFORME CON FILTROS
- Vinculación y desvinculación en gráficos
INTRODUCCIÓN A DAX (DATA ANALYSIS EXPRESSIONS)
- Introducción a DAX
- Tablas y columnas calculadas, medidas simples
- Filtrado de filas y medidas avanzadas
- Creación de métricas y gráficos avanzados
MÓDULO 4. INTRODUCCIÓN A TABLEAU: VISUALIZACIÓN
TABLEAU I
- Comprensión básica de Tableau
- Conexión a fuente/base de datos
- Combinación de datos
- Editar y guardar fuente de datos
- Dimensiónes y métricas
TABLEAU II
- Conversión tipo de datos
- Representación gráfica de los datos
- Filtrado de informes y características
- Creación Jerarquías y drill down
TABLEAU III
- Creación campos calculados. (medidas y dimensiones)
- Creación de parámetros
- Combinación campos calculados y parámetros
- Descripciones emergentes
MÓDULO 5. TABLEAU AVANZADO: VISUALIZACIÓN II
TABLEAU AVANZADO I
- Creación de grupos
- Creación de conjuntos
- Expresiones LOD
TABLEAU AVANZADO II
- Creación de dashboard
- Objetos dashboard
- Fomatos Dashboard
- Interactividad Dashboard
TABLEAU AVANZADO III
- Extensiones Tableau
- Configuración Extensión
- Gráficos no nativos
MOVILIDAD Y COLABORACIÓN
- Creación de historias
- Adaptación de informes para móvil y Tablet
ECOSISTEMA BIG DATA
- Definición de componentes y arquitectura
- Disponibilidad, Escalabilidad y Resiliencia
- Introducción a Hadoop y MapReduce
ESTRATEGIAS BASADAS EN DATOS
- Cuadros de Mando (Dashboards)
- Business Intelligence vs Big Data
ENTORNOS DE PROCESAMIENTO
- Cloud Computing
- Internet de las Cosas (IoT)
- Casos de uso de Big Data: ejemplos en la industria
MÓDULO 2: EL DATO Y SU CICLO DE VIDA
DATOS
- El Dato
- Calidad del dato
- Derechos sobre los datos
CICLO DE VIDA DEL DATO
- Fuentes de datos
- Adquisición de datos
- Tratamiento, Carga y procesamiento
- Almacenamiento de datos
- Análisis para la explotación
- Visualización y Storytelling para la explotación
- La selección de los elementos visuales
- Toma de decisiones
MÓDULO 3: ALMACENAMIENTO ESCALABLE DE DATOS
SISTEMAS DISTRIBUIDOS (HADOOP)
BASES DE DATOS NO ESTRUCTURADAS (MONGODB)
BASES DE DATOS DE GRAFOS (NEO4J O SPARK GRAPH X)
MÓDULO 4: ARQUITECTURA BIG DATA
EL ECOSISTEMA HADOOP
- Introducción a Hadoop
- Herramientas del ecosistema Hadoop
CLUSTER Y SISTEMAS DISTRIBUIDOS (HDFS, MAPREDUCE)
ANÁLISIS DE DATOS CON HIVE Y PIG
PROCESAMIENTO DE DATOS CON SPARK
- Spark RDD (Resilient Distributed Datsets)
- Spark Streaming
- Spark SQL
MÓDULO 5: ANÁLISIS PARA LA EXPORTACIÓN DE DATO
PERFILES DE DATOS
- Científicos de datos
- Ingeniero de datos
ANÁLISIS EXPLORATORIO DE DATOS
- Estadística descriptiva
- Distribución de los datos
- Exploración de datos categóricos y binarios
- Correlación
- Exploración de 2 o más variables
TÉCNICAS DE MUESTREO DE DATOS
- Selección aleatoria
- Selección Bias
- Selección por distribución estadística
CONTRASTE DE HIPÓTESIS
- Testeo de muestras A/B
- Testeo de hipótesis
- Significancia estadística y P-value
- P-VALUE
REGRESIÓN Y PREDICCIÓN
- Regresión Linear
- Regresión Multilineal
- Interpretar los resultados de una regresión
- Predecir usando regresión
APRENDIZAJE SUPERVISADO
- Conceptos
- Algoritmos: Arboles de decisión
APRENDIZAJE NO SUPERVISADO
- Componentes principales
- Algoritmos: K-Means, Clusters Jerárquicos
INTRODUCCIÓN AL DEEP LEARNING
- Conceptos fundamentales
- Redes Neuronales
MÓDULO 6: PRESENTACIÓN PROYECTOS BIG DATA Y STORYTELLING
PRESENTACIÓN DE UN PROYECTO BIG DATA
- La importancia del contexto
- La audiencia y su importancia
COMPONENTES PARA LA PRESENTACIÓN DE UN PROYECTO BIG DATA
- Ideas de diseño
APACHE HADOOP
MÓDULO 1. INTRODUCCIÓN AL BIG DATA
CONCEPTOS BÁSICOS
- Definición y conceptos
- Evolución de los datos
SQL VS NOSQL
PREPARACIÓN ENTORNO DE TRABAJO
MÓDULO 2. APACHE HADOOP (HDFS)
CONCEPTOS BÁSICOS Y ARQUITECTURA
- Conceptos fundamentales
- Arquitectura Hadoop
LECTURA, ESCRITURA Y REPLICACIÓN
PERMISOS Y BORRADO DE DATOS
SAFEMODE, SNAPSHOTS Y GESTIÓN DE CACHÉ
PROFUNDIZANDO CON LA SHELL
MÓDULO 3. MAP REDUCE & YARN
MAP REDUCE: EL ALGORITMO
- Arquitectura
- Configuración
IMPLEMENTACIÓN DE ALGORITMOS MAP REDUCE
MANERAS DE EJECUTAR EL ALGORITMO
YARN: ARQUITECTURA, GESTIÓN DE COLAS Y ZOOKEEPER
MÓDULO 4. ECOSISTEMA HADOOP
APACHE HIVE
- Arquitectura
- Componentes
APACHE SQOOP
- Arquitectura
- Componentes
APACHE PIG
- Arquitectura
- Componentes
- Pig Latin
APACHE SPARK
- Arquitectura
- Componentes
- Tipos de datos
- Integración con Hive
REPORTING CON ZEPPELIN
- La importancia del reporting
- Creación de reportes con Zeppelin
BUSINESS INTELLIGENCE
MÓDULO 1. INTRODUCCIÓN AL BI
HISTORIA Y EVOLUCIÓN DEL BI
- ¿Qué es el BI?
- Componentes BI.
- Fuentes de información
CONCEPTOS BÁSICOS BI.
- Herramientas/procesos básicos BI.
MODELADO DE DATOS
- Modelo en estrella
- Modelo copo de nieve
- Modelo multidimensional
APROVISIONAMIENTO DE DATOS
- Datawarehouse
- Datamart
- Principales diferencias
MÓDULO 2. ETL E INTRODUCCIÓN A LA VISUALIZACIÓN
PROCESOS DE EXTRACCIÓN TRANSFORMACIÓN Y CARGAS Y HERRAMIENTAS
- Diseño de proceso ETL.
- Principales herramientas del mercado y particularidades
INTRODUCCIÓN A LA VISUALIZACIÓN
- Introducción a la visualización de la información
- Beneficios de la visualización
- Categorías de la visualización
HERRAMIENTAS Y PARTICULARIDADES
- Principales herramientas del mercado y comparativa
MÓDULO 3. INTRODUCCIÓN AL POWER BI
COMPRENSIÓN BÁSICA DE POWERBI
- ¿Qué es?
- ¿Para qué sirve?
- Interfaz
CONEXIÓN A ORÍGENES DE DATOS
EDITOR POWER QUERY
- Formateo de datos
- Detección de errores
- Pivot
CREACIÓN DE GRÁFICOS
CONSTRUCCIÓN DE INFORME CON FILTROS
- Vinculación y desvinculación en gráficos
INTRODUCCIÓN A DAX (DATA ANALYSIS EXPRESSIONS)
- Introducción a DAX
- Tablas y columnas calculadas, medidas simples
- Filtrado de filas y medidas avanzadas
- Creación de métricas y gráficos avanzados
MÓDULO 4. INTRODUCCIÓN A TABLEAU: VISUALIZACIÓN
TABLEAU I
- Comprensión básica de Tableau
- Conexión a fuente/base de datos
- Combinación de datos
- Editar y guardar fuente de datos
- Dimensiónes y métricas
TABLEAU II
- Conversión tipo de datos
- Representación gráfica de los datos
- Filtrado de informes y características
- Creación Jerarquías y drill down
TABLEAU III
- Creación campos calculados. (medidas y dimensiones)
- Creación de parámetros
- Combinación campos calculados y parámetros
- Descripciones emergentes
MÓDULO 5. TABLEAU AVANZADO: VISUALIZACIÓN II
TABLEAU AVANZADO I
- Creación de grupos
- Creación de conjuntos
- Expresiones LOD
TABLEAU AVANZADO II
- Creación de dashboard
- Objetos dashboard
- Fomatos Dashboard
- Interactividad Dashboard
TABLEAU AVANZADO III
- Extensiones Tableau
- Configuración Extensión
- Gráficos no nativos
MOVILIDAD Y COLABORACIÓN
- Creación de historias
- Adaptación de informes para móvil y Tablet
SALIDAS PROFESIONALES
Con esta formación podrás ejercer como profesional cualificado en puestos de trabajo de:
- Data Scientist
- Data Consultant
- Arquitecto de datos
- Big Data Developer
TE RECOMENDAMOS VER TAMBIÉN
En los siguientes enlaces podrás ver programas formativos similares:
Opiniones
No hay opiniones registradas para este curso