O Data Center Cloudera Data Platform (CDP) é uma plataforma de dados completa que unifica as mais recentes análises de código aberto – Spark, Impala, Hive, HBase, Kafka, Hadoop e muito mais – em um sistema de análise multifuncional e gerenciamento de dados que apresenta:
- Análise SQL de alto desempenho
- Processamento e gerenciamento de stream em tempo real
- Controle de acesso granular baseado em atributos
- Filtragem de coluna dinâmica e mascaramento de linha
- Um aumento de 10 vezes na escalabilidade de arquivos e objetos
Usei um módulo Terraform (v0.12) que implanta o CDP Data Center no Oracle Cloud Infrastructure (OCI).
Este modelo tem suporte para direcionar VCN/Sub-redes existentes para implantação de cluster. Para ativar essa funcionalidade, basta usar o sistema de menu do esquema para selecionar um destino de VCN existente e, em seguida, selecionar as sub-redes apropriadas para cada tipo de host de cluster.
1. Faça download do arquivo zip para a implantação do Cloudera Terraform com o Resource Manager .
2. Faça login na Oracle Cloud Infrastructure (OCI)
3. Selecione Gerenciador de recursos e clique em Pilhas
4. Clique em Criar pilha .
5. Nas Informações da pilha página faça o upload do arquivo zip que você baixou na etapa 1 e clique em Próximo .
6. Em Configurar variáveis página, insira o conteúdo de uma “chave fornecida SSH” (opcional). Observação:se você implantar o Cloudera Manager em uma sub-rede privada, precisará de uma VPN ou túnel SSH por meio de um nó de borda para acessar o gerenciamento de cluster. Ao criar uma VPC, você deve especificar um intervalo de endereços IPv4 para a VPC na forma de um bloco Classless Inter-Domain Routing (CIDR), por exemplo, 10.0.0.0/16. Clique em Avançar .
7. Verifique sua configuração e clique em Criar.
9. Em Ações do Terraform menu selecione Plano
10. Clique em Planejar
11. Aguarde alguns instantes até que este trabalho seja concluído.
12. O Terraform foi inicializado com sucesso.
13. Trabalho concluído com sucesso
14. Diagrama mostrando o que normalmente é implantado usando este modelo. Esses recursos são distribuídos automaticamente entre “Domínios de Falhas” em um “Domínio de Disponibilidade” para garantir a tolerância a falhas.
Referências
Saiba mais sobre a implantação do Hadoop no Oracle Cloud Infrastructure. Disponível em https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Implante facilmente o Hadoop no Oracle Cloud Infrastructure usando o Resource Manager. Disponível em https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera no Oracle Cloud Infrastructure (modelo de implantação do Terraform). Disponível em https://github.com/oracle-quickstart/oci-cloudera
Visão geral do Gerenciador de Recursos. Disponível em https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
Centro de Dados CDP. Disponível em https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html