A ideia é melhorar o desempenho das consultas de agregação usando MapReduce em um banco de dados fragmentado distribuído em várias máquinas.
Fiz algumas comparações do desempenho do Mapreduce do Mongo com uma instrução group-by-select no Oracle na mesma máquina. Descobri que o Mongo era aproximadamente 25 vezes mais lento. Isso significa que tenho que fragmentar os dados em pelo menos 25 máquinas para obter o mesmo desempenho com o Mongo que o Oracle oferece em uma única máquina. Usei uma coleção/tabela com aproximadamente 14 milhões de documentos/linhas.
Exportar os dados do mongo via mongoexport.exe e usar os dados exportados como uma tabela externa no Oracle e fazer um group-by no Oracle foi muito mais rápido do que usar o MapReduce do próprio Mongo.