MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Particionar dados em torno de uma consulta de correspondência durante a agregação


Esta agregação dá o resultado desejado.
db.posts.aggregate( [
{ $match:  { updatedAt: { $gte: 1549786260000 } } },
{ $facet: {
        FALSE: [
            { $match: { toggle: false } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : 1 } } },
        ],
        TRUE: [
            { $match: { toggle: true, status: "INACTIVE" } },
            { $unwind : "$interests" },
            { $group : { _id : { iid: "$interests", pid: "$publisher" }, count: { $sum : -1 } } },
        ]
} },
{ $project: { result: { $concatArrays: [ "$FALSE", "$TRUE" ] } } },
{ $unwind: "$result" },
{ $replaceRoot: { newRoot: "$result" } },
{ $group : { _id : "$_id", count: { $sum : "$count" } } },
{ $project:{ _id: 0, iid: "$_id.iid", pid: "$_id.pid", count: 1 } }
] )


[EDITAR ADICIONAR]

A saída da consulta usando os dados de entrada da postagem da pergunta:
{ "count" : 1, "iid" : "INT123", "pid" : "P789" }
{ "count" : 1, "iid" : "INT123", "pid" : "P123" }
{ "count" : 0, "iid" : "INT789", "pid" : "P789" }
{ "count" : 1, "iid" : "INT456", "pid" : "P789" }



[EDITAR ADICIONAR 2]
Esta consulta obtém o mesmo resultado com abordagem diferente (código):
db.posts.aggregate( [
  { 
      $match:  { updatedAt: { $gte: 1549786260000 } } 
  },
  { 
      $unwind : "$interests" 
  },
  { 
      $group : { 
          _id : { 
              iid: "$interests", 
              pid: "$publisher" 
          }, 
          count: { 
              $sum: {
                  $switch: {
                      branches: [
                        { case: { $eq: [ "$toggle", false ] },
                           then: 1 },
                        { case: { $and: [ { $eq: [ "$toggle", true] },  { $eq: [ "$status", "INACTIVE" ] } ] },
                           then: -1 }
                      ]
                  }          
              } 
          }
      } 
  },
  { 
      $project:{
           _id: 0, 
           iid: "$_id.iid", 
           pid: "$_id.pid", 
           count: 1 
      } 
  }
] )


[EDITAR ADICIONAR 3]

OBSERVAÇÃO:

A consulta de faceta executa as duas facetas (VERDADEIRO e FALSO) no mesmo conjunto de documentos; é como duas consultas sendo executadas em paralelo. Mas, há alguma duplicação de código, bem como estágios adicionais para moldar os documentos no pipeline para obter a saída desejada.

A segunda consulta evita a duplicação de código e há estágios muito menores no pipeline de agregação. Isso fará diferença quando o conjunto de dados de entrada tiver um grande número de documentos para processar - em termos de desempenho. Em geral, estágios menores significam menos iterações dos documentos (já que um estágio precisa digitalizar os documentos que são produzidos no estágio anterior).