MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Como agrupar por campos diferentes


Isso foi difícil!

Primeiro, a solução simples:
db.test.aggregate([
 { "$match": { "user": "Hans" } },
 // duplicate each document: one for "age", the other for "childs"
 { $project: { age: "$age", childs: "$childs",
               data: {$literal: ["age", "childs"]}}},
 { $unwind: "$data" },
 // pivot data to something like { data: "age", value: "40" }
 { $project: { data: "$data",
               value: {$cond: [{$eq: ["$data", "age"]},
                               "$age", 
                               "$childs"]} }},
 // Group by data type, and count
 { $group: { _id: {data: "$data", value: "$value" }, 
             count: { $sum: 1 }, 
             value: {$first: "$value"} }},
 // aggregate values in an array for each independant (type,value) pair
 { $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
 // project value to the correctly name field
 { $project: { result: {$cond: [{$eq: ["$_id", "age"]},
                               {age: "$values" }, 
                               {childs: "$values"}]} }},
 // group all data in the result array, and remove unneeded `_id` field 
 { $group: { _id: null, result: { $push: "$result" }}},
 { $project: { _id: 0, result: 1}}
])

Produzindo:
{
    "result" : [
        {
            "age" : [
                {
                    "count" : 3,
                    "value" : "40"
                },
                {
                    "count" : 1,
                    "value" : "50"
                }
            ]
        },
        {
            "childs" : [
                {
                    "count" : 1,
                    "value" : "1"
                },
                {
                    "count" : 3,
                    "value" : "2"
                }
            ]
        }
    ]
}

E agora, algumas explicações:

Um dos principais problemas aqui é que cada documento recebido deve fazer parte de dois somas diferentes. Resolvi isso adicionando uma matriz literal ["age", "childs"] aos seus documentos e, em seguida, desenrolando-os por essa matriz. Dessa forma, cada documento será apresentado duas vezes na fase posterior.

Feito isso, para facilitar o processamento, altero a representação dos dados para algo muito mais gerenciável, como { data: "age", value: "40" }

As etapas a seguir realizarão a agregação de dados per se. Até o terceiro $project etapa que mapeará os campos de valor para a age correspondente ou childs campo.

As duas etapas finais simplesmente agruparão os dois documentos em um, removendo o _id desnecessário campo.

Pfff!