BIG DATA & DATA SCIENCE - Machine Learning
- Artificial Intelligence
- Python, R, Jupyter
Marca la diferencia ... actualízate - Data Visualization
- CDE, CDA, CDF
- Hadoop, Spark
- entre otros.
Contáctanos BigData Data Science Visualization Consultoría Contacto Home About Albums Videos Tours Contacts
shadow
Descripción del Curso
El curso de capacitación en “BIG DATA, & VISUAL ANALYTICS CON PENTAHO BA”, sienta sus bases en difundir de manera práctica los conceptos clave, la arquitectura, herramientas y tecnologías de Big Data y su aplicación en el negocio potenciando su aprendizaje de forma aplicada, con el uso de la suite de analítica Pentaho BA (Business Analytics), abarca desde los fundamentos de Hadoop, manejo de los lenguajes de programación python, R, uso de spark y streaming, aprenderás los fundamentos en base a laboratorios de machine learning, así como a realizar la ingesta y tratamiento de datos con Pentaho BA, el proyecto final incluye el despliegue de la solución con la visualización profesional de cuadros de mando empresariales, explotando la potencia que nos entrega la suite de analítica Pentaho BA, para ello se desarrollará un caso de estudio con el objetivo que los participantes consoliden el aprendizaje de estas nuevas tecnologías.
Audiencia
El Curso de Big Data & Visual Analytics con Pentaho , Hadoop, Spark, MongoDB, Cassandra, etc. Está dirigido a profesionales de ingeniería, técnicos o afines, así como a desarrolladores de software y analistas de datos que trabajen actualmente con bases de datos de cualquier tipo o desarrollen o utilicen aplicaciones orientadas a la manipulación y análisis de datos, así como a Directivos y emprendedores, que quieran potenciar sus conocimientos de Big data, desde una perspectiva práctica y de negocio con perfiles profesionales o especialistas en áreas funcionales de Operaciones, Marketing, Ventas, Big Data e Inteligencia Comercial, responsables de PYMES o emprendedores.
Docentes
– Mg. Eder Pineda Claros: Ingeniero de Computación y Sistemas con gran capacidad de desempeño y enfocado a lograr soluciones inmediatas a los negocios utilizando herramientas de inteligencia de negocio y analíticas, desempeñándose actualmente como Coordinador de Big Data Analytics en Entel Perú:

  • Maestría en Ciencia de los Datos de la Universidad Ricardo Palma
  • Magister Business Intelligence de la Universidad de Barcelona
  • Arquitecto de integración en EGS Group
  • Implementador Business Analytics en Pentaho Perú
  • Docente de cursos en estadística para no estadísticos en la Universidad Ricardo

– Ing. Pablo Valdivia; Business Development Manager y director de la oficina de Perú y Ecuador de EGS GROUP Business Solutions.
Ejecutivo Senior en Tecnologías de la Información, con más de 20 años de experiencia en Business Analytics, Big Data, así como en Dirección de Proyectos & Gerencia en tecnologías de la Información, asesor empresarial y especialista en Gobierno Electrónico, con dominio de tecnologías emergentes como Pentaho, Power BI, Microstrategy, Tableau, IDempiere, Odoo, SuiteCRM, R, Python, Java, Linux, Unix y experto en balanced scorecard con experiencia en los sectores de Banca, Industria Manufactura y Extractiva, Servicios, Comunicaciones, Entretenimiento y Gobierno en instituciones en el Perú y en el extranjero. Orientado hacia la mejora de procesos y estrategias de negocio, Sólidos conocimientos de reingeniería de procesos, de Gerencia de Proyectos en implementación de Sistemas Empresariales ERP, CRM, e-Business.

Objetivos
  • Gana agilidad en la toma de decisiones.
  • Detecta nuevas oportunidades de negocio.
  • Explota la analítica para el desarrollo de tu negocio.
  • Convierte grandes volúmenes de datos en información válida y relevante.
  • Mejora el conocimiento de tus clientes.
  • Aprende a implementar estrategias basadas en datos.
  • Conoce la arquitectura, distribuciones y ecosistema Hadoop.
  • Conocimientos básicos del lenguaje de programación Python.
  • Conocimientos del ambiente de cómputo distribuido en el lenguaje Python.
  • Técnicas de ingesta de datos con HDFS, Sqoop y Pyspark.
  • Procesamiento distribuido de grandes volúmenes de datos (Pyspark).
  • Procesamiento distribuido en NRT (Pyspark).
  • Conocimientos básicos de Machine Learning aplicados a un caso de Negocio.
  • Técnicas Analíticas con Pyspark, Hive e Impala
Beneficios
  • Certificado por haber aprobado el Curso de Especialización en Big Data Aplicado expedido por Pentaho Perú y EGS GROUP. Para obtener el certificado deberá tener la nota mínima de catorce (14).
  • Material Digital.
  • Especialización desde cualquier lugar del mundo a tiempo real.
  • Clases 100% prácticas y dinámicas, con casos reales del día a día con PENTAHO.
  • Acceso a la clase grabada.
  • Soporte constante en todas las clases.
  • Instructor/Consultor Senior Certificado.
  • Acceso a la plataforma de PENTAHO por 30 días después de haber finalizado la clase.
Metodología
Con el propósito de facilitar la asimilación del conocimiento por parte de los participantes, los cursos hacen uso de una moderna plataforma tecnológica que posee las siguientes características:
  • Permite el dictado de las sesiones en tiempo real, a través de la plataforma los participantes pueden ver y oír al expositor en línea.
  • Permite la interacción en tiempo real entre el expositor y los participantes, además pueden participar activamente durante el dictado de la sesión haciendo preguntas o contribuyendo con comentarios relevantes de igual manera la plataforma permite la interacción entre los participantes.
Plan de Estudios

INTRODUCCION AL BIG DATA

  • Conceptos Big Data
  • Planificación analítica
  • Arquitectura informacional
  • El Chief Data Officer
  • Importancia del Big Data
  • Almacenamiento y cloud computing
  • Arquitectura de soluciones
  • Plataformas big data
  • Pipeline Arquitectura Tradicional
  • Pipeline Arquitectura Big Data
  • Infraestructura On Premise – Cloud

DATA LAKE Y GOBIERNO

  • Data lake
  • Seguridad
  • Modelo de gobierno

FUNDAMENTOS HADOOP

  • Que es Apache Hadoop?
  • Componentes de Hadoop
  • HDFS
  • MapReduce
  • Yarn
  • Common Utilities
  • Ecosistema Hadoop
  • Distribuciones Hadoop

DATA Y VISUAL ANALYTICS

  • Datos de cliente, web y movilidad
  • Privacidad de datos
  • Customer Behavior + Experience
  • Web Analytics
  • Social Media Analytics
  • Visualización para la toma de decisiones

DATA INGESTION

  • Serialización
  • Estructura HDFS
  • Comandos HDFS
  • Sqoop

FUNDAMENTOS SPARK

  • Introducción a Apache Spark
  • Spark Driver, Workers process and cluster manager.
  • RDDs, Daframes y Datasets.
  • Manejo de archivos y conexiones.
  • SparkSQL
  • Operaciones con dataframes

FUNDAMENTOS ARQUITECTURA STREAMING

  • Apache Kafka:
    Tecnologías de Streaming y Near Real Time
    Conociendo Kafka
    Arquitectura:
      • Consumers
      • Producers
      • Topics
      • Kafka streaming
    Conectando Kafka con diferentes vendors
    Tunning y solución de problemas
  • Apache Spark Streaming:
    Conceptos de streaming
    Arquitectura
    Integración con kafka
    Tunning y problemas comunes
  • Cassandra:
    Tunning y problemas comunes
    Conceptos de Nodo, Data center, Cluster,Commit log,Mem-table,SSTable,Bloom filter
    Arquitectura
    Introducción a CQL
    Integración con Spark Streaming
    Tunning y problemas comunes

DATA ANALYSIS

  • Hive
  • Impala
  • Pyspark

MACHINE LEARNING

  • Generación de modelos Random forest, Decision tree, Gradient boosted tree, Logistic regression, Multilayer perceptron (neural net), Naive Bayes
  • Ejecución de modelos – vía Shell.

DESARROLLO DE UN CASO DE USO EN CLOUDERA CDH

  • Ingesta: HDFS, Sqoop, PySpark
  • Procesamiento: Hive, Impala, PySpark
  • Analítica: Pyspark + Machine Learning (MLib)

DESARROLLO DE APLICACIONES BIG DATA CON PYTHON

  • Python para el Análisis de Datos.
  • Python IDE, Jupyter, Ipython, Numpy, Pandas.
  • Visualización de datos.
  • Introducción al lenguaje R.
  • Ejemplos de uso de R para análisis de datos.
PRECIO

$1,299

$899

PEN 3146.5

Consulta Inversión Solidaria

#YoMeQuedoEnCasa
#YoMeFormoEnCasa

15 estudiantes

Duración : 56 Horas

Clases : 12

Online en Vivo
Acceso a videos de clases

De Lunes a Sábado
de 19:00 a 23:00

CURSOS RELACIONADOS A BIG DATA EXPERT

Nuestros Cursos Todos los cursos

Aprende sin secretos la creación de dashboards profesionales, incluyendo google maps, CartoDB, integra librería de terceros, incluye componentes de visualziación en tiempo real


más información

shadow

Procesa los datos con la potencia de Pentaho Data Integration, sumándole la simplicidad y potencia de la visualización de datos de Power BI. Marca al diferencia. Actualízate.

más información

shadow

   Te responderemos en un máximo de 24 horas

 Comparte tus datos con nosotros y te ayudaremos a descubrir lo que necesitas