MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Remodelar documentos dividindo um valor de campo

A maneira ideal no MongoDB versão 3.4.


Esta versão do mongod fornece o $split operador que, é claro, divide a string conforme mostrado aqui .

Em seguida, atribuímos o valor recém-calculado a uma variável usando o $let operador variável. O novo valor pode ser usado no in expressão para retornar os valores "name" e "age" usando o $arrayElemAt operador para retornar o elemento em um índice especificado; 0 para o primeiro elemento e -1 para o último elemento.

Observe que no in expressão, precisamos dividir o último elemento para retornar a string de inteiro.

Finalmente, precisamos iterar o Cursor object e converta a string de inteiro para numérico usando Número ou parseInt e use a operação em massa e o bulkWrite() método para $set o valor para esses campos para máxima eficiência.
let requests = [];
db.coll.aggregate(
    [
        { "$project": {  
            "person": { 
                "$let": { 
                    "vars": { 
                        "infos":  { "$split": [ "$person", "," ] } 
                    }, 
                    "in": { 
                        "name": { "$arrayElemAt": [ "$$infos", 0 ] }, 
                        "age": { 
                            "$arrayElemAt": [ 
                                { "$split": [ 
                                    { "$arrayElemAt": [ "$$infos", -1 ] }, 
                                    " " 
                                ]}, 
                                -1 
                            ] 
                        } 
                    } 
                } 
            }  
        }}
    ] 
).forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.person.name, 
                    "age": Number(document.person.age) 
                },
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 ops and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

 // Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB 3.2 ou mais recente.


O MongoDB 3.2 descontinua o antigo Bulk() API e seus métodos associados e fornece o bulkWrite() mas não fornece o $split operador, então a única opção que temos aqui é usar o mapReduce() método para transformar nossos dados e, em seguida, atualizar a coleção usando a operação em massa.
var mapFunction = function() { 
    var person = {}, 
    infos = this.person.split(/[,\s]+/); 
    person["name"] = infos[0]; 
    person["age"] = infos[2]; 
    emit(this._id, person); 
};

var results = db.coll.mapReduce(
    mapFunction, 
    function(key, val) {}, 
    { "out": { "inline": 1 } }
)["results"];

results.forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.value.name, 
                    "age": Number(document.value.age) 
                }, 
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 operations and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

// Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB versão 2.6 ou 3.0.


Precisamos usar a agora obsoleta API em massa .
var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;

results.forEach(function(document) { 
    bulkOp.find({ "_id": document._id}).updateOne(
        { 
            "$set": { 
                "name": document.value.name, 
                "age": Number(document.value.age)
            },
            "$unset": { "person": " " }
        }
    );
    count++;
    if (count === 500 ) {
        // Execute per 500 operations and re-init
        bulkOp.execute();
        bulkOp = db.coll.initializeUnorderedBulkOp();
    }
});

// clean up queues
if (count > 0 ) {
    bulkOp.execute();
}