Database
 sql >> Base de Dados >  >> RDS >> Database

Planilhas x Bancos de Dados:É Hora de Mudar? Parte 1


Planilhas – Excel, Google Sheets ou uma planilha com qualquer outro nome – são ferramentas muito legais e poderosas. Mas então, os bancos de dados também. Quando você deve ficar com uma planilha? Quando você deve migrar para um banco de dados?

Você pode usar planilhas e bancos de dados para fins semelhantes. Dado que ambos organizam os dados e facilitam os relatórios, às vezes pode ser difícil determinar qual é o melhor a ser usado. Então, vamos falar sobre os prós e contras de cada opção.

No começo…


Se você está apenas começando nos negócios, uma planilha (ou uma “planilha”) é quase sempre sua primeira escolha. As startups raramente têm orçamento para suportar um banco de dados personalizado. Além disso, seu negócio é novo; você não terá ideia se permanecerá pequeno, se tornará uma grande corporação ou estará em algum lugar no meio.

Outro fator é que a estrutura e a organização da sua empresa provavelmente mudarão à medida que ela crescer. Então, realmente, construir um banco de dados no início não é uma opção comum. Este é o lugar onde as folhas geralmente saltam.

A razão mais importante para usar folhas é que elas estão disponíveis. Você pode começar a usar o Microsoft Excel, o Planilhas Google ou qualquer outro programa de planilha com apenas alguns cliques. Você não precisa planejar uma estrutura complicada; você pode simplesmente inserir seus dados, fazer cálculos e relatórios e compartilhar as informações com colegas de trabalho. O Planilhas oferece muitos recursos integrados interessantes e pode acompanhar uma pequena empresa por um bom tempo.

Então, digamos que você tenha todos os seus dados em planilhas. Por que você deve considerar construir um banco de dados? Em outras palavras, por que complicar sua vida se tudo está dando certo?

Neste ponto, sugiro que você se pergunte o quão bem tudo está funcionando. Lembre-se, tudo funciona bem até parar de funcionar. No caso das planilhas, quanto mais dados você tiver, mais problemas poderá ter. Como os bancos de dados ajudam a evitar esses problemas? E quando você deve considerar a mudança?

Usando planilhas para organizar dados


Vamos supor que começamos uma empresa que fornece serviços de telecomunicações e Internet para clientes. Precisamos rastrear qual cliente atualmente assina qual serviço. Os clientes podem ter mais de um serviço ativo por vez, e o serviço pode expirar no final de um período definido ou ser renovado automaticamente.

Vamos dar uma olhada em uma solução que usa planilhas.



Simplesmente fizemos uma lista de todos os dados que temos, ou seja, há uma mistura de dados em um só lugar. Temos dados do cliente (colunas A a E), tipos de serviço (coluna F) e detalhes do serviço (colunas G, H e J).

À primeira vista, tudo parece muito bom. Podemos visualizar todos os dados sem realizar nenhuma ação complexa. Podemos filtrar os dados de que precisamos e criar tabelas dinâmicas ou gráficos para fins de relatório. Até agora tudo bem.

Mas se continuarmos a usar folhas quando conseguirmos mais clientes, podemos chegar a um ponto em que tudo se torna grande demais para as folhas gerenciarem. E isso traz um novo conjunto de problemas.

Potenciais problemas com planilhas


Comparados às planilhas, os bancos de dados são complicados. Mas essas “complicações” servem a um propósito útil; previnem ou pelo menos minimizam os seguintes problemas:

Qualidade de dados


A qualidade e a consistência dos dados são um grande problema para planilhas maiores. Embora pretendamos armazenar dados corretamente, problemas de qualidade de dados são muito comuns. As pessoas cometem erros ou temos informações inesperadas para inserir. Basta pensar em como os cenários abaixo podem apresentar um problema:
  1. Queremos adicionar um novo cliente sem especificar o tipo de serviço. Devemos adicionar os detalhes do cliente e deixar de fora os detalhes do serviço? Se pudermos inserir apenas clientes que tenham detalhes do serviço, isso é uma inserir anomalia .
  2. E se adicionarmos dados de serviço quando estiverem disponíveis, depois de criar o registro do cliente?
  3. E se um cliente assinar vários serviços? Devemos criar um novo registro para cada serviço, já que só podemos ter um tipo de serviço por registro?
  4. E se tivermos vários registros de um cliente e precisarmos atualizar as informações desse cliente? A menos que alteremos as informações em todas as linhas relevantes, nossos dados serão inconsistentes. Poderíamos ter dois endereços diferentes para a mesma conta; nessa circunstância, como podemos saber quais dados estão corretos?
  5. O que acontece quando excluímos dados? Se excluirmos a linha inteira, perderemos todos os dados desse cliente. Isso não é uma boa ideia; é melhor remover apenas os dados de serviço e manter os dados dos clientes. Mas como podemos fazer isso se tudo estiver armazenado em uma linha?
  6. E se apenas um cliente assinar um serviço e excluirmos esse registro? Se excluirmos o registro desse cliente, também excluiremos todos os registros desse serviço? (Isso é chamado de excluir anomalia .) Isso significa que não oferecemos mais esse serviço? Se ainda o oferecemos, perdemos todos os parâmetros relacionados a esse serviço.

Obviamente, haverá complicações no armazenamento de dados para qualquer negócio. Todos nós já tivemos problemas de qualidade de dados – por exemplo, recebemos faturas por serviços que não solicitamos, fomos cobrados duas vezes pela mesma coisa ou um pacote foi enviado para o endereço errado. Essas coisas acontecem e, em um pequeno conjunto de dados, é relativamente fácil corrigi-las. Mas o que acontece quando temos milhares ou mesmo milhões de linhas? Em breve estaríamos dedicando quase todo o nosso tempo para corrigir esses problemas.

Problemas de desempenho


Problemas de desempenho acontece quando os conjuntos de dados ficam muito grandes para uma planilha lidar com eficiência. Você enfrentará problemas de qualidade de dados muito mais cedo do que problemas de desempenho, mas isso não significa que os problemas de desempenho não sejam importantes. Au contraire; problemas de desempenho podem ser ainda mais perigosos do que problemas de qualidade de dados.

É comum pesquisar linhas específicas, inserir novas linhas, atualizar ou excluir valores de células em linhas existentes e excluir linhas inteiras. Todas essas ações exigem muita filtragem, o que não é problema em um conjunto de dados pequeno. Mas quando suas folhas se tornam muito grandes, até mesmo uma operação simples pode levar minutos. Passar metade do seu dia de trabalho esperando que o filtro faça seu trabalho dificilmente é uma escolha sábia.

Há também o problema relacionado de redundância – armazenar os mesmos dados várias vezes no disco (por exemplo, os dados do cliente são armazenados repetidamente em várias linhas). Isso também terá um impacto no desempenho.

Em hardware decente, planilhas com milhares de linhas ficarão bem. Mas quando você entra em dezenas de milhares de linhas, os problemas de desempenho podem aparecer. Desnecessário dizer que folhas com centenas de milhares ou mesmo milhões de linhas terão um desempenho extremamente ruim.

Por outro lado, os bancos de dados estão aqui para resolver problemas de desempenho. Quando tudo estiver configurado corretamente, trabalhar com milhões de linhas não representará nenhum desafio.

Gerenciando dados históricos e relatórios


Mais um problema importante com planilhas é acompanhar as alterações de dados ao longo do tempo. Se você simplesmente excluir dados das planilhas, você os perderá. Se você decidir armazenar uma planilha diária (para capturar todas as alterações e preservar os dados históricos), logo se verá enterrado sob toneladas de planilhas. Criar relatórios a partir de tal estrutura é realmente demorado, e a qualidade de quaisquer relatórios gerados a partir dela seria muito questionável.

Você enfrenta esses problemas com seus dados?


No artigo de hoje, discutimos algumas desvantagens de usar planilhas para organizar muitos dados. Você já passou por algum desses problemas? Você está pronto para levar o seu negócio para o próximo nível? Se a resposta for “sim”, você está no lugar certo! Na próxima semana, aprenderemos como um banco de dados resolve problemas de armazenamento de dados em planilhas.