O Cloudera Manager 4.7 adicionou suporte para gerenciar o Cloudera Search 1.0. Assim, os usuários do Cloudera Manager podem implantar facilmente todos os componentes do Cloudera Search (incluindo o Apache Solr) e gerenciar todos os serviços relacionados, assim como todos os outros serviços incluídos no CDH (distribuição do Cloudera do Apache Hadoop e projetos relacionados).
Neste tutorial, você aprenderá as etapas envolvidas na adição do Cloudera Search a um cluster Cloudera Enterprise (CDH + Cloudera Manager).
Instalando o Pacote SOLR
Em nosso exemplo, o cluster usa um pacote CDH 4.4 e está executando os serviços Apache ZooKeeper, HDFS e Apache HBase. (Os pacotes são uma maneira realmente útil de implantar novos softwares e fazer atualizações indolores por meio do Cloudera Manager.)
Se você quiser baixar o pacote SOLR diretamente do Cloudera, você pode usar as configurações padrão para “URLs do Repositório de Parcelas Remotas” (sob Parcels seção na guia Administração) conforme mostrado abaixo:
Definindo o URL do repositório do Parcel
Se você quiser usar um repositório local (ou seja, primeiro baixe o pacote do Cloudera e depois instale a partir da cópia local), siga as instruções aqui. Os próximos passos são “Baixar”, “Distribuir” e “Ativar” o pacote na página Parcels na guia Hosts.
Implantando o lote SOLR
Uma vez que o pacote é ativado, você tem todos os componentes do Cloudera Search (Solr, Lily HBase Indexer e Apache Flume’s Morphlines Sink) prontos para serem usados junto com o CDH.
A próxima etapa é adicionar o serviço Apache Solr ao cluster. No menu "Ações" do seu cluster na guia Serviços, escolha "Adicionar um serviço", que o levará ao "Assistente para adicionar serviço" no Cloudera Manager. Depois de seguir as etapas do assistente e escolher onde os servidores Solr devem ser executados, você chegará a uma página de fluxo de trabalho que inicializará o serviço Solr e iniciará todos os servidores Solr.
Colocando o serviço Solr em funcionamento
É isso - o serviço Solr está pronto para uso! Siga as instruções no Guia do usuário do Cloudera Search para criar coleções e adicionar documentos a elas para indexação. A captura de tela abaixo mostra como criar uma coleção usando o esquema Solr padrão.
Criando a primeira coleção
Adicionando o Lily HBase Indexer
O Cloudera Manager 4.7 também oferece suporte para o Lily HBase Indexer incluído no pacote SOLR. O Lily HBase Indexer Service é um sistema flexível, escalável, tolerante a falhas, transacional e em tempo quase real para processar um fluxo contínuo de atualizações de células HBase em índices de pesquisa ao vivo. Para usá-lo, adicione o serviço “Keystore Indexer” por meio do “Add Service Wizard”.
No entanto, antes de poder usar o Lily HBase Indexer, você precisa garantir que a replicação e a indexação estejam habilitadas no serviço HBase no cluster. Você pode alterar essas propriedades na página de configuração do serviço HBase na seção “Backup”.
Definindo as propriedades do HBase para o Lily HBase Indexer
Além disso, observe que o Cloudera Manager inclui um arquivo Cloudera Morphlines padrão que pode ser usado pelo Lily HBase Indexer. Para modificar esse arquivo para usar suas próprias funções, você deve navegar até o serviço Keystore Indexer e modificar a configuração do Morphlines conforme mostrado abaixo:
Editando Cloudera Morphlines para Lily HBase Indexer
Depois que essas alterações forem feitas, você poderá começar a usar o Lily HBase Indexer para indexar quaisquer dados que chegam ao HBase seguindo as instruções no Lily HBase Indexer User Guide . Esta postagem de blog também fornece um ótimo exemplo de como indexar e-mails usando o HBase e o Cloudera Search.
Conclusão
Agora você sabe como é fácil implantar, configurar e gerenciar um serviço Cloudera Search em seu cluster CDH usando o Cloudera Manager. A partir do Cloudera Enterprise 5 (em versão beta no momento da redação deste artigo), o Cloudera Search e o indexador Lily HBase serão instalados e iniciados por padrão, tornando esse processo ainda mais fácil.
Vikram Srivastava é engenheiro de software na Cloudera.