HBase
 sql >> Base de Dados >  >> NoSQL >> HBase

Apache Phoenix para CDH

Apache Phoenix para CDH:Melhor novo recurso para DBMS


A Cloudera está adotando e dará suporte ao Apache Phoenix para CDH enquanto o integra à sua Cloudera Data Platform no futuro.

As versões do CDH da Cloudera incluem o Apache HBase que fornece um banco de dados NoSQL resiliente para aplicativos operacionais de clientes que desejam aproveitar o poder do big data. Esses aplicativos se transformaram em aplicativos de missão importante e de missão crítica que geram receita de primeira linha e lucratividade de linha de fundo. Esses aplicativos incluem aplicativos voltados para o cliente, plataformas de comércio eletrônico, detecção de risco e fraude usados ​​nos bastidores em bancos ou servindo modelos de IA/ML para aplicativos e permitindo treinamento adicional de reforço dos mesmos com base em resultados reais.

No entanto, para muitos clientes, o HBase tem sido uma jornada muito assustadora - exigindo que eles aprendam
  • Um novo modelo de dados como o HBase é um esquema de tabela ampla com suporte a milhões de colunas, mas sem junções e
  • Usando APIs Java em vez de ANSI SQL

Eles pediram para poder usar um design de esquema mais tradicional que se assemelhasse ao fornecido pela Oracle ou MySQL e estavam dispostos a fazer algumas trocas na flexibilidade, por exemplo,
  • Eles estão dispostos a usar os tipos de dados fornecidos em vez de definir seus próprios
  • Eles estão dispostos a abrir mão da flexibilidade de ter uma única coluna com vários tipos, dependendo da linha, em troca de um único tipo em uma única linha

Para permitir que os clientes tenham acesso fácil aos outros benefícios do Apache HBase (expansão ilimitada, milhões de linhas, evolução de esquema, etc.) box, etc), estamos introduzindo suporte para Apache Phoenix no CDH.



Para todos os outros, os aplicativos baseados em Phoenix também se beneficiam das otimizações do HBase nos bastidores, tornando mais fácil obter um melhor desempenho do HBase. Por exemplo, o Phoenix implementa a salga de chaves primárias - para que os usuários do HBase não precisem pensar nesse aspecto do design de chaves.

Além disso, os aplicativos baseados em Phoenix podem coexistir com aplicativos HBase — o que significa que você pode usar um único cluster HBase para dar suporte a ambos. Com o Phoenix, os clientes podem continuar a usar suas ferramentas favoritas de BI e dashboards, assim como faziam com o Hive &Impala no passado. Ao usar o Phoenix, eles também podem optar por usar o Phoenix diretamente com essas ferramentas, além da opção de usar o Hive / Impala eliminando uma etapa para novas implementações.



De uma perspectiva de segurança e governança (SDX), no CDH, o Phoenix usa ACLs HBase para controle de acesso baseado em função para tabelas Phoenix. O Phoenix também usa a integração do HBase no Cloudera Navigator para obter informações de auditoria.

A Cloudera lançou um pacote Phoenix 4.14.1 disponível para clientes CDH 5.16.2 e um pacote Phoenix 5.0 disponível para clientes CDH 6.2+.

Os clientes HDP existentes já têm suporte ao Apache Phoenix e quase metade dos usuários do HBase que usam o HDP atualmente usam o Phoenix, além de falar de sua popularidade na comunidade de usuários do HBase.

Faça o download do Apache Phoenix para CDH 

Crie aplicativos de missão crítica usando o Apache Phoenix. Faça o download do software aqui.



Perguntas frequentes sobre Phoenix




P) Quais são as cargas de trabalho para as quais o Phoenix deve ser usado

O Phoenix oferece suporte aos mesmos casos de uso do HBase, principalmente cargas de trabalho de baixa latência e alta simultaneidade. No entanto, o Phoenix torna mais simples também aproveitar os dados subjacentes para fins de dashboard e BI

P) Qual é o mecanismo de autorização com o Phoenix?

Phoenix depende do HBase para autorização. Para clientes CDH, isso utiliza ACLs HBase. Para clientes HDP, isso ocorre por meio da integração HBase-Ranger

P)  Qual é a escalabilidade do Phoenix? Qual é o maior cluster conhecido?

Phoenix escala para centenas de TB de dados. O maior cliente tem mais de 0,5 PB de dados gerenciados pela Phoenix. Detalhes sobre casos de uso podem ser encontrados nos arquivos da PhoenixCon e nos arquivos dos vídeos do dia NoSQL no início deste ano em palavras e slides dos próprios usuários.

P) O Phoenix oferece suporte à indexação secundária geoespacial? Qual nível de suporte a dados espaciais?

Tem suporte limitado para dados geoespaciais. No entanto, o GeoMesa fornece uma camada geoespacial no HBase que pode atender a essa necessidade e ser integrada aos aplicativos do cliente. Phoenix, GeoMesa, JanusGraph e OpenTSDB podem coexistir em um único cluster HBase.

P) Como você cria e usa um índice?

Consulte a página Indexação secundária do Phoenix para obter detalhes sobre a indexação. A partir do Phoenix 4.8.0, nenhuma alteração de configuração é necessária para usar a indexação local.

P)  Existe um limite no número de colunas que você pode colocar no índice?

Como em um RDBMS, um índice é essencialmente uma tabela separada com o índice e um link para os dados de origem. Se você indexar todas as colunas, você anula o objetivo mantendo duas tabelas idênticas. Os índices devem ser usados ​​criteriosamente, pois há alguma sobrecarga não trivial na gravação (índices globais) ou na leitura (índices locais).