Sobre o Curso
Neste curso, você irá aprender a implementar processos de ETL com o auxilio da ferramenta Pentaho Data Integration, exercitando casos práticos de carga de dados em um Data Warehouse. Tudo através de uma metodologia (Ralph Kimball) que conduz o aluno pelas fases reais de um projeto de carga de dados em um DW.
Objetivos da Aprendizagem
- Aprendendo os conceitos de ETL
- O entendimento completo dos componentes da ferramenta Pentaho Data Integration
- Desenvolvido com o Pentaho Data Integration (Kettle)
- Carregando Dimensões e Fatos
- Como exercitar as melhores práticas de desenvolvimento
- O porquê de uma Staging Area
- Como implementar Slowly Chenge Dimension do tipo I e II
- Aplicando o Role-Playing Dimensions
- Usando os principais steps para Transformation e Jobs
- Carregar Aggregation Tables
- Agendamento de processos de ETL
- Enviar email em caso de falha ou sucesso
Ferramentas utilizadas neste treinamento
- Pentaho Data Integration Community Edition: Spoon e Kitchen
Requisito para um melhor aproveitamento
- Ter cursado o curso DIM1000 ou ter conhecimento equivalente
Benefícios do Treinamento
- O Aluno terá entendimento completo da ferramenta Pentaho Data Integration e todo o seus componentes (Spoon, Pan, Kitchen e Carte). Através de exercícios práticos e seguindo um roteiro de Projeto, o aluno poderá desenvolver o seu projeto real de ETL logo em seguida ao término do treinamento.
Depoimento de Cliente
- “Obtive mais compreensão na manipulação de jobs e transformações…” por Samuel Santos, Analista de Sistemas – Comunix
Idioma
- Ministrado em Português e Material didático em formato eletrônico em Português
Conteúdo Programático
- Compreendendo o Data WarehouseO processo de ETL (do inglês Extract, Transform and Load)
- Conceituação sobre estratégias de cargas
- Apresentando o Pentaho Data Integration (também conhecido como Kettle)
- Passos para popular uma Staging Area com transformações
- Passos para popular um Data Warehouse (Data Marts) com transformações
- Trabalhando com repositório de metadados
- Criando e Compartilhando conexões JDBC e JNDI
- Usando variáveis para conexões e caminhos de arquivos/pastas
- Padrões de projeto (Design Patterns)
- Inserção e atualização de registros (Slowly Change Dimension, tipo 1 e 2)
- Carregando tabelas agregadas
- Gerenciamento de erro em tempo de execução (Error handling)
- Identificação visual de gargalos de processamento
- Orquestrando processos de ETL com jobs
- Executando processos de ETL por linha de comando
- Agendando processos de ETL
- Enviando e-mail de sucesso e/ou falha
- Visualizando e gerando logs de execução
Formatos
- EaD – Clique aqui para conhecer
- Presencial em turma aberta
- Presencial in-company
Carga horária
- 8 horas
Confira os nossos outros cursos