Database
 sql >> Base de Dados >  >> RDS >> Database

ScyllaDB Trends – Como os usuários implantam o banco de dados de Big Data em tempo real

ScyllaDB é um armazenamento de dados NoSQL distribuído de código aberto, reimplementado a partir do popular banco de dados Apache Cassandra. Lançado há apenas quatro anos em 2015, o Scylla teve um crescimento médio de mais de 220% ano a ano em popularidade de acordo com a DB-Engines. Ouvimos muito sobre esse banco de dados em ascensão da comunidade DBA e de nossos usuários e decidimos nos tornar um patrocinador do Scylla Summit deste ano para saber mais sobre as tendências de implantação de seus usuários. Neste post, detalhamos as implantações na nuvem do ScyllaDB versus no local, os provedores de nuvem mais populares, os bancos de dados SQL e NoSQL usados ​​com o ScyllaDB, as tarefas de gerenciamento mais demoradas e por que você deve usar o ScyllaDB versus o Cassandra.

  • ScyllaDB x Cassandra
  • ScyllaDB Cloud x ScyllaDB no local
  • Provedores de nuvem mais populares para ScyllaDB
  • Bancos de dados mais usados ​​com ScyllaDB
  • Tarefas de gerenciamento ScyllaDB mais demoradas

ScyllaDB vs. Cassandra – Qual é melhor?

Quer saber qual armazenamento de coluna larga usar para suas implantações? Enquanto o Cassandra ainda é o mais popular, o ScyllaDB está ganhando rapidamente como a 7ª loja de colunas largas mais popular de acordo com DB-Engines. Então, quais são algumas das razões pelas quais os usuários escolheriam ScyllaDB versus Cassandra?

O ScyllaDB oferece latência significativamente menor, o que permite processar um grande volume de dados com o mínimo de atraso. Na verdade, de acordo com o relatório de benchmark de desempenho do ScyllaDB, sua latência de 99,9 percentil é até 11 vezes melhor do que o Cassandra no AWS EC2 bare metal. Então esse tipo de desempenho tem que ter um custo, certo? Sim, mas eles afirmam neste relatório que é uma redução de custo de 2,5 vezes em comparação com a execução do Cassandra, pois eles podem atingir esse desempenho com apenas 10% dos nós.

Existem dezenas de artigos de qualidade sobre ScyllaDB vs. Cassandra, então vamos parar aqui para que possamos chegar ao objetivo real deste artigo, detalhando os dados do usuário do ScyllaDB .

ScyllaDB Cloud vs. ScyllaDB On-Premises

O ScyllaDB pode ser executado tanto na nuvem pública quanto no local. Na verdade, o ScyllaDB é mais popularmente implantado em ambientes de nuvem pública e local em uma única organização. Os 44% das implantações do ScyllaDB aproveitando a computação em nuvem e no local podem ser por meio de um ambiente de nuvem híbrida aproveitando um aplicativo específico ou usando esses ambientes separadamente para gerenciar diferentes aplicativos.

As implantações no local do ScyllaDB e as implantações na nuvem do ScyllaDB ficaram inoperantes, mesmo com 28% cada. Você pode executar o ScyllaDB e o ScyllaDB Enterprise de código aberto gratuito na nuvem ou no local, e a licença do ScyllaDB Enterprise começa em US$ 28,8 mil/ano para um total de 48 núcleos.


Qual é a melhor maneira de implantar o #ScyllaDB? Cloud vs. On-PremiseClick To Tweet

Provedores de nuvem mais populares para ScyllaDB

Com 28% do cluster ScyllaDB sendo implantado exclusivamente na nuvem e 72% usando a nuvem em alguma capacidade, estávamos interessados ​​em ver quais provedores de nuvem são mais populares para cargas de trabalho ScyllaDB .

#1. AWS

Descobrimos que 39,1% de todas as implantações de nuvem do ScyllaDB estão sendo executadas na AWS a partir de nossos participantes da pesquisa. Embora esperássemos que a AWS fosse o provedor de nuvem nº 1 para o ScyllaDB, a porcentagem foi consideravelmente menor do que as respostas de todos os tipos de banco de dados em nuvem nesta pesquisa, que relataram que 55% estavam implantando na AWS. Esse número está mais alinhado com nosso recente Relatório de tendências de banco de dados de código aberto de 2019, onde 56,9% das implantações de nuvem foram relatadas em execução na AWS. Isso pode ocorrer porque a AWS não oferece suporte ao ScyllaDB por meio de seus Relational Database Services (RDS), portanto, podemos supor que, à medida que mais organizações continuarem a migrar seus dados para o ScyllaDB, a AWS poderá sofrer um declínio em sua base de clientes.

#2. Google Cloud

O Google Cloud Platform (GCP) foi o segundo provedor de nuvem mais popular para ScyllaDB, chegando a 30,4% de todas as implantações de nuvem. O Google Cloud oferece seu próprio armazenamento de colunas amplo e banco de dados de big data chamado Bigtable, que na verdade está classificado em 111º, um abaixo do ScyllaDB em 110º em DB-Engines. Os recursos de baixo custo e alto desempenho do ScyllaDB o tornam uma opção atraente para usuários do GCP, especialmente porque é de código aberto em comparação com o Bigtable, que está disponível comercialmente apenas no GCP.

#3. Azure

O Azure ficou em terceiro lugar, representando 17,4% de todas as implantações do ScyllaDB na nuvem de nossos entrevistados. O Azure é um provedor de nuvem atraente para organizações que aproveitam o pacote de serviços da Microsoft.


Qual provedor de nuvem é mais popular para #ScyllaDB? AWS x Azure x GCPClick To Tweet

Os 13,0% restantes das implantações em nuvem do ScyllaDB estavam sendo executados nos serviços de computação em nuvem DigitalOcean, Alibaba e Tencent.

O serviço gerenciado deles, Scylla Cloud, está disponível atualmente apenas na AWS, e você deve usar a versão ScyllaDB Enterprise para aproveitar o DBaaS. O Scylla Cloud planeja adicionar suporte para GCP e Azure no futuro, mas com apenas 39% de relatórios na AWS, podemos supor que mais de 60% das implantações do ScyllaDB estão sendo autogerenciadas na nuvem.

Bancos de dados mais usados ​​com ScyllaDB

Como também descobrimos no Relatório de Banco de Dados de Código Aberto de 2019, as organizações utilizam, em média, 3,1 tipos diferentes de banco de dados. Mas, nesta pesquisa, as organizações que usam o ScyllaDB relataram usar apenas 2,3 tipos de banco de dados diferentes em média, uma redução de 26% em comparação com nossos resultados de todos os usuários de banco de dados de código aberto. Também descobrimos que 39% das implantações do ScyllaDB estão usando apenas o ScyllaDB e não aproveitam nenhum outro tipo de banco de dados em seus aplicativos.

Então, quais bancos de dados são mais comumente usados ​​em conjunto com o ScyllaDB? Descobrimos que os usuários do ScyllaDB também estão usando bancos de dados SQL MySQL 20% do tempo e PostgreSQL 20% do tempo também. O segundo banco de dados mais usado com ScyllaDB foi o Cassandra, representado em 16% das implantações, e podemos supor que isso seja por organizações que testam o ScyllaDB como uma alternativa ao Cassandra em seus aplicativos, pois ambos os tipos de banco de dados são armazenamentos de colunas amplas.

MongoDB foi o quarto banco de dados mais popularmente implantado com ScyllaDB em 12%. Redis e Elasticsearch ficaram empatados em quinto lugar, ambos aproveitando 8% do tempo com implantações do ScyllaDB.


Também descobrimos que 20% das implantações do Scylla estão aproveitando outros tipos de banco de dados, incluindo Oracle, Aerospike, Kafka (que agora está se transformando em um banco de dados de streaming de eventos), DB2 e Taranool.

Tarefas de gerenciamento ScyllaDB mais demoradas

Sabemos que o ScyllaDB é muito poderoso, mas é fácil usá-lo? Perguntamos aos usuários do ScyllaDB qual era a tarefa de gerenciamento mais demorada e ouvimos de 28% que o Scylla Repair era a tarefa de gerenciamento mais longa. O Scylla Repair é um processo de sincronização executado em segundo plano para garantir que todas as réplicas eventualmente mantenham os mesmos dados. Os usuários devem executar o comando nodetool repair regularmente, pois não há como automatizar reparos nas versões de código aberto do ScyllaDB ou ScyllaDB Enterprise, mas você pode configurar um cronograma de reparo por meio do Scylla Manager.

A análise de consultas lentas do ScyllaDB vinculou os backups e as recuperações do ScyllaDB ao segundo lugar a 14% cada para a tarefa de gerenciamento mais demorada. Não parece que o ScyllaDB atualmente tenha um analisador de consultas disponível para identificar as consultas que precisam ser otimizadas, mas os usuários podem usar o Log de consultas lentas para ver quais consultas têm o maior tempo de resposta. Os backups do ScyllaDB também não podem ser automatizados por meio das versões de código aberto e corporativo, mas afirmam que os backups recorrentes estarão disponíveis em edições futuras do Scylla Manager. Também não há uma maneira automatizada de restaurar um backup do ScyllaDB, pois eles devem ser executados manualmente em todas as versões.

10% dos usuários do ScyllaDB relataram que adicionar, remover ou substituir nós era a tarefa mais demorada, ficando em quarto lugar. Esses são processos manuais que podem levar um pouco de tempo, especialmente se você estiver lidando com um grande tamanho de dados. A adição de nós é usada para dimensionar uma implantação enquanto a remoção deles reduz sua implantação. Os nós devem ser substituídos se estiverem inativos ou inativos, embora um cluster ainda possa estar disponível quando mais de um nó estiver inativo.

Empatado em quinto lugar com 7% foram atualizações e solução de problemas. O ScyllaDB Enterprise e o software livre exigem etapas extensas para atualizar um cluster. Os métodos recomendados são por meio de um procedimento de rolagem para que não haja tempo de inatividade, mas este é um processo manual, portanto, o usuário deve desativar um nó por vez, executar todas as etapas de atualização, reiniciar e validar o nó antes de prosseguir para a execução do mesmas etapas para os nós restantes no cluster. De fato, demorado, mas felizmente não é uma tarefa diária! A solução de problemas é, obviamente, uma toca de coelho profunda para mergulhar, mas os clientes do ScyllaDB Enterprise recebem suporte de missão crítica 24 horas por dia, 7 dias por semana, e os usuários de código aberto têm acesso a uma infinidade de recursos, incluindo documentação, listas de discussão, Scylla University e um canal slack para usuários discussões.


Qual é a tarefa de gerenciamento #ScyllaDB mais demorada?Clique para tweet

Os 21% restantes das tarefas demoradas relatadas pelos usuários do ScyllaDB incluem monitoramento, migrações, provisionamento, balanceamento de fragmentos, compactação e aplicação de patches.

Então, como esses resultados se comparam às suas implantações do ScyllaDB? Você está procurando uma maneira de automatizar essas tarefas de gerenciamento demoradas? Embora ofereçamos suporte ao banco de dados MySQL, PostgreSQL, Redis™* e MongoDB® hoje, estamos sempre procurando feedback sobre qual banco de dados adicionar suporte para o próximo por meio de nossos planos de DBaaS. Deixe-nos saber nos comentários ou no Twitter em @scalegridio se você está procurando uma maneira mais fácil de gerenciar seus clusters ScyllaDB na nuvem ou no local!