O MongoDB armazena dados em um formato totalmente diferente, chamado BSON, que vai ocupar mais espaço em disco. Não só os valores precisam ser armazenados para cada campo, mas também terá que armazenar os nomes das colunas novamente em cada documento (linha). Se você tiver nomes de colunas grandes, isso pode definitivamente aumentar o tamanho no MongoDB para 8 a 10 vezes o seu arquivo CSV. Se possível, você pode encurtar seus nomes de campo se isso for demais para você.
O MongoDB também pré-aloca arquivos de dados para você. Por exemplo, no momento em que ele começa a adicionar dados a
taq.2
, ele criará taq.3
, e da mesma forma quando ele começa a gravar em taq.4
ele cria tag.5
. Então, no seu caso, digamos que seu arquivo de 230 MB criaria 1,9 GB de dados, o MongoDB já alocou o taq.5
com tamanho de 2,0 G . Este comportamento pode ser desativado especificando --noprealloc
na linha de comando ao iniciar o mongod
.