MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Contar com eficiência a porcentagem de ocorrência no MongoDB


Aqui está um simples MapReduce que vai fazer o que você quer:
map = function() {
    for (var key in this.values){
        emit(key, {count:1, trues: (this.values[key] ? 1 : 0)});
    }
}

reduce = function(key, values){
    var out = values[0];
    for (var i=1; i < values.length; i++){
        out.count += values[i].count;
        out.trues += values[i].trues;
    }
    return out;
}

finalize = function(key, value){
    value.ratio = value.trues / value.count;
    return value;
}

db.runCommand({mapReduce:'collection',
               map:map,
               reduce:reduce,
               finalize:finalize,
               out:'counts'
               })

db.counts.findOne({_id:'alpha'})
{_id: 'alpha', value: {count: 100, trues: 52, ratio: 0.52}}

Você também pode fazer um upsert assim quando você insere em sua coleção principal, o que lhe dará uma visão em tempo real de seus dados:
for (var key in this.values){
    db.counts.update({_id:key},
                     {$inc:{count:1, trues: (this.values[key] ? 1 : 0)}},
                     true);
}

Na verdade, você pode até combinar esses métodos. Faça um trabalho em lote MapReduce único para preencher a coleção de contagens e, em seguida, use upserts para mantê-lo atualizado.