Sobre o Curso


Neste curso, você irá aprender a implementar processos de ETL com o auxilio da ferramenta Pentaho Data Integration, exercitando casos práticos de carga de dados em um Data Warehouse. Tudo através de uma metodologia (Ralph Kimball) que conduz o aluno pelas fases reais de um projeto de carga de dados em um DW.

Objetivos da Aprendizagem
  • Aprendendo os conceitos de ETL
  • O entendimento completo dos componentes da ferramenta Pentaho Data Integration
  • Desenvolvido com o Pentaho Data Integration (Kettle)
  • Carregando Dimensões e Fatos
  • Como exercitar as melhores práticas de desenvolvimento
  • O porquê de uma Staging Area
  • Como implementar Slowly Chenge Dimension do tipo I e II
  • Aplicando o Role-Playing Dimensions
  • Usando os principais steps para Transformation e Jobs
  • Carregar Aggregation Tables
  • Agendamento de processos de ETL
  • Enviar email em caso de falha ou sucesso
Ferramentas utilizadas neste treinamento
  • Pentaho Data Integration Community Edition: Spoon e Kitchen
Requisito para um melhor aproveitamento
  • Ter cursado o curso DIM1000 ou ter conhecimento equivalente
Benefícios do Treinamento
  • O Aluno terá entendimento completo da ferramenta Pentaho Data Integration e todo o seus componentes (Spoon, Pan, Kitchen e Carte). Através de exercícios práticos e seguindo um roteiro de Projeto, o aluno poderá desenvolver o seu projeto real de ETL logo em seguida ao término do treinamento.
Depoimento de Cliente
  • “Obtive mais compreensão na manipulação de jobs e transformações…” por Samuel Santos, Analista de Sistemas – Comunix
Idioma
  • Ministrado em Português e Material didático em formato eletrônico em Português

 

Conteúdo Programático
  • Compreendendo o Data WarehouseO processo de ETL (do inglês Extract, Transform and Load)
  • Conceituação sobre estratégias de cargas
  • Apresentando o Pentaho Data Integration (também conhecido como Kettle)
  • Passos para popular uma Staging Area com transformações
  • Passos para popular um Data Warehouse (Data Marts) com transformações
  • Trabalhando com repositório de metadados
  • Criando e Compartilhando conexões JDBC e JNDI
  • Usando variáveis para conexões e caminhos de arquivos/pastas
  • Padrões de projeto (Design Patterns)
  • Inserção e atualização de registros (Slowly Change Dimension, tipo 1 e 2)
  • Carregando tabelas agregadas
  • Gerenciamento de erro em tempo de execução (Error handling)
  • Identificação visual de gargalos de processamento
  • Orquestrando processos de ETL com jobs
  • Executando processos de ETL por linha de comando
  • Agendando processos de ETL
  • Enviando e-mail de sucesso e/ou falha
  • Visualizando e gerando logs de execução
Formatos
  • EaD – Clique aqui para conhecer
  • Presencial em turma aberta
  • Presencial in-company
Carga horária
  • 8 horas
Confira os nossos outros cursos