Pentaho versão 8: Aqui está o que há de novo e melhorado

Pentaho, um produto que originalmente foi lançado há mais de uma década, como um pacote de inteligência de negócios de código aberto, em breve estará disponível em uma versão 8.0.

Pentaho existiu como uma empresa independente durante mais de uma década, até que foi adquirida pela Hitachi Data Systems (HDS) em 2015. HDS integrou Pentaho em suas próprias ofertas e implementações de serviços, mas por outro lado deixou a maioria das coisas que funcionam como estavam, antes da aquisição. Isso mudou no mês passado, quando Hitachi anunciou que estava combinando Pentaho, HDS e Hitachi introspecção Group (a unidade responsável pela plataforma Lumada IoT ) em uma única nova divisão chamada Hitachi Vantara .

Enquanto Pentaho como uma empresa foi eliminada, o produto Pentaho e marca não tem o mesmo destino. Para tornar esse ponto mais relevante, aconteceu na semana passada a conferência Pentaho World, em Orlando, Florida e nesse evento, foi anunciado a primeira nova versão da suite Pentaho na era Hitachi Vantara, Pentaho 8.0, com disponibilidade a partir do próximo mês.

O que há de novo
Embora BI / analytics ainda é uma parte importante da Pentaho, o conjunto agora se estende muito além disso, e inclui a integração de dados e mineração de dados (na forma do pacote de Ciência de Dados ). Na verdade, é o Pentaho Data Integration (PDI) componente que apresenta maior destaque nesta nova versão. Da Hitachi Vantara Arik Pelkey, diretor sênior de marketing de produto Pentaho, e Anand Rao, Pentaho Product Marketing Manager, deram mais detalhes.

Os novos recursos do Pentaho 8.0 decompõem-se em três áreas principais. Estes são, nas palavras da própria Hitachi Vantara: melhorar a conectividade para streaming de fontes de dados para o processamento de dados em tempo real; optimização dos recursos de processamento; e aumentar a produtividade da equipe. Vejamos estes em ordem.

Streaming
No lado do fluxo de dados, Pentaho está adicionando suporte para dois motores de processamento Apache Software Foundation Projects: Kafka e Spark. Kafka é suportado como fonte para transmissão de dados através de um novo conector, enquanto Spark e Spark Stream são usados para processar esses dados.

Além disso, a Camada de Execução Adaptive (AEL) recurso que foi adicionado no Pentaho 7.1 será usado para processamento em tempo real, permitindo streaming de trabalho de fluxos de dados a ser concebido, que pode então executar contra própria Pentaho Kettle motor de integração de dados ou Spark. Pelkey e Rao explicaram que um padrão comum pode emergir onde Kettle é usado no desenvolvimento e teste, com Spark sendo usado na produção. Suporte para outros motores está previsto, como se torna evidente no diagrama acima da arquitetura.

Gestão
No lado da Gestão dos Recursos processamento, Hitachi Vantara é a adição de uma escala fora arquitetura, permitindo que o motor Kettle a ser implantado em um cluster de nós de trabalho com base em contêiner, ao invés de um único servidor. Work Nodes não executará trabalhos individuais de forma distribuída, mas eles podem ser usados para executar várias tarefas em paralelo. Pelkey e Rao explicaram que Kettle e Spark Work Modes podem ser sobrepostos no mesmo cluster físico.

Execução Adaptive é agora certificada compatível com Hortonworks Hadoop Cluster, além de Cloudera clusters, que eram suportados na versão anterior. Há suporte para Apache Knox neste comunicado também: Pentaho 8.0 adiciona suporte para Apache Knox para autenticação cluster (o que faz sentido, uma vez que Hortonworks é a maior entidade comercial por trás desse projeto), e adiciona suporte para Apache Avro e Parquet de formatos de arquivo.

E mais
Além disso, o componente Data Explorer da Pentaho Data Integration, que permite a visualização de dados como ele está sendo preparados e transformados, agora suporta a funcionalidade de filtragem que não estava disponível na versão anterior. Comunicado de imprensa da empresa também explica que Pentaho 8.0 adiciona melhor usabilidade de repositório e mais facilidade de auditoria da aplicação.

Considerando as origens da Pentaho, a plataforma agora oferece suporte a várias grandes tecnologias e padrões de dados de código aberto, tanto para dados em repouso quanto em dados de transmissão. Sua aplicabilidade ao Enterprise BI, à ciência dos dados e à Internet das Coisas, e sua integração corporativa com duas unidades de negócios Hitachi previamente separadas focadas nesses espaços, o tornam um produto muito diferente do que era no seu início.

Pentaho evoluiu com a indústria; vamos ver se a sua união em Hitachi Vantara fornece ainda maior velocidade em que a evolução.

A Openin Big Data é uma empresa de Tecnologia da Informação, brasileira, que nasceu com uma missão muito específica, ser um provedor de serviços especializado no desenvolvimento de soluções de Data Warehouse e Business Intelligence, atuando de forma exclusiva com a tecnologia Pentaho (líder mundial em solução de Integração de Dados e Business Intelligence) em nossas implementações de DW/BI.

Somos pioneiros e referência no Brasil e América Latina há mais de 9 anos no uso das ferramentas Pentaho, trabalhando com treinamento, desenvolvimento, consultoria e suporte. Esta dedicação plena ao uso da tecnologia Pentaho, nos coloca em uma posição de destaque onde nossos clientes enxergam de imediato o valor proporcionado a eles.

Contatos:
info@openin.com.br
+55 11 4038-3181/4039-6066

fonte:
http://www.zdnet.com/article/pentaho-version-8-announced/

Copyright © 2018 Openin. Todos os direitos reservados.