Nota do editor, agosto de 2020:O CDP Data Center agora é chamado de CDP Private Cloud Base. Você pode saber mais sobre isso aqui.
O banco de dados operacional da Cloudera (OpDB) em CDP oferece um OpDB escalável em tempo real, sempre disponível, que atende dados estruturados tradicionais juntamente com novos dados não estruturados em uma plataforma operacional e de armazenamento unificada. A Cloudera oferece um banco de dados operacional que atende dados estruturados tradicionais juntamente com novos dados não estruturados em uma plataforma unificada de código aberto.
O banco de dados operacional ajuda você a:
Operacionalize o aprendizado de máquina/inteligência artificial para revolucionar setores como saúde, serviços públicos, etc.
- Exiba conteúdo em tempo real em escala da web.
- Fortaleça a análise de big data para usos operacionais e off-line.
- Use como um armazenamento resiliente de registros.
Atualmente, o OpDB em CDP está disponível em dois formatos:como uma oferta totalmente segura e semigerenciada em CDP Public Cloud – Data Hub, e como uma oferta totalmente personalizável em CDP Data Center – semelhante ao que já está disponível em CDH e HDP. Você pode escolher um fator de forma com base em sua estratégia de implantação e necessidades de OpDB. O banco de dados operacional usa um armazenamento de objetos, como o Amazon S3, como uma camada de armazenamento para o Apache HBase, em que os HFiles são gravados no armazenamento de objetos, mas os WALs são gravados no HDFS.
O banco de dados operacional no CDP possui os seguintes componentes:
- Apache Phoenix uma interface SQL que roda em cima do Apache HBase.
- O Apache HBase foi projetado para uma escalabilidade massiva, para que você possa armazenar quantidades ilimitadas de dados em uma única plataforma e lidar com as demandas crescentes de fornecimento de dados.
- O Apache ZooKeeper fornece um serviço de configuração distribuído, um serviço de sincronização e um registro de nomenclatura.
- O Apache Knox Gateway oferece segurança de perímetro para que a empresa possa estender o acesso com confiança a novos usuários.
- O Apache HDFS é usado para escrever as WALs do Apache HBase.
- O armazenamento de objetos, como Amazon S3 e Microsoft ADLS Gen2, é usado para armazenar os HFiles do Apache HBase.
- A Experiência de Dados Compartilhados (SDX) é usada para recursos de segurança e governança. As políticas de segurança e governança são definidas uma vez e aplicadas em todos os dados e cargas de trabalho.
- IDBroker é uma API REST criada como parte dos serviços de autenticação do Apache Knox. Ele permite que um usuário autenticado e autorizado troque um conjunto de credenciais ou um token por tokens de acesso de fornecedor de nuvem.
Banco de dados operacional na série CDP
Este artigo forneceu uma introdução sobre o OpDB no CDP e sua arquitetura. Você pode aprender mais sobre cada aspecto do OpDB e descobrir os novos recursos e capacidades do OpDB nos próximos artigos desta série. Atualizaremos os links para cada postagem do blog à medida que forem publicados.
Acessibilidade
O OpDB da Cloudera garante que os usuários possam acessar ou recuperar dados armazenados. Ele suporta fragmentação automática e fragmentação predefinida, três mecanismos de consulta e várias ferramentas de integração de dados. Este artigo fornece uma visão geral desses recursos e outros recursos que garantem um alto nível de acessibilidade.
Administração
O OpDB da Cloudera fornece várias ferramentas e recursos de administração para administrar sua carga de trabalho do OpDB. Os administradores podem implantar o OpDB como uma oferta totalmente segura e semigerenciada no CDP Public Cloud – Data Hub e como uma oferta totalmente personalizável no CDP Data Center (semelhante ao que está disponível no CDH e HDP). Este artigo fornece uma visão geral de alto nível de quais recursos e ferramentas têm suporte para administrar o OpDB no CDP.
Gerenciamento
O OpDB da Cloudera fornece ferramentas de gerenciamento que ajudam você a gerenciar com eficiência suas cargas de trabalho do OpDB. Este artigo fornece uma visão geral das ferramentas e recursos de gerenciamento do OpDB no CDP.
Disponibilidade
O OpDB da Cloudera mantém um alto nível de disponibilidade de dados, garantindo que os dados necessários estejam acessíveis quando e onde for necessário, mesmo que ocorra uma falha no nó. Este artigo fornece uma visão geral dos recursos que possibilitam um alto nível de disponibilidade, como alta disponibilidade pronta para uso, replicação de dados e proteção contra erros.
Integridade
O OpDB da Cloudera fornece vários recursos de integridade de dados, incluindo integridade de entidade e domínio, transações ACID e integridade não relacional. Este artigo fornece uma visão geral dos recursos de integridade de dados do OpDB.
Suporte a aplicativos
O OpDB da Cloudera oferece suporte a várias linguagens, estruturas e aplicativos populares que você pode usar para acessar dados armazenados em seu OpDB. Este artigo fornece uma visão geral das linguagens, estruturas e aplicativos com suporte.
NoSQL e recursos relacionados
Como o OpDB da Cloudera inclui o banco de dados NoSQL HBase para armazenar dados, ele possui recursos NoSQL, como valores de chave, recursos de estilo de tabela e tipos de dados flexíveis. A integração total em todo o ecossistema Hadoop também é fornecida, incluindo HDFS, Spark e Kafka. Este artigo fornece uma visão geral desses recursos.
Escalabilidade
O OpDB da Cloudera foi projetado para alta escalabilidade, suportando escalabilidade vertical e horizontal com tipo de dados flexível e sem limite de tamanho de dados. Este artigo fornece uma visão geral dos recursos e ferramentas relacionados à escalabilidade com suporte.
Segurança
O OpDB da Cloudera oferece várias soluções de segurança em diferentes níveis, em criptografia, autenticação, autorização e auditoria. Este artigo fornece uma visão geral desses recursos e ferramentas relacionados à segurança.
Para obter mais informações, acesse:Introdução ao Banco de Dados Operacional.