MongoDB
 sql >> Base de Dados >  >> NoSQL >> MongoDB

Como normalizar/reduzir os dados de tempo no mongoDB?


Aqui está como você pode fazer isso na estrutura de agregação. Estou usando uma pequena simplificação - estou agrupando apenas em Ano, Mês e Data - no seu caso, você precisará adicionar hora e minuto para os cálculos mais refinados. Você também tem a opção de fazer a média ponderada se a distribuição de pontos não for uniforme na amostra de dados obtida.
project={"$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
};
group={"$group" : {
        "_id" : {
            "a" : "$array_serial",
            "P" : "$Port Name",
            "y" : "$year",
            "m" : "$month",
                    "d" : "$day"
        },
        "avgMetric" : {
            "$avg" : "$metric"
        }
    }
};

db.metrics.aggregate([project, group]).result

Eu executei isso com alguns dados de amostra aleatórios e obtive algo deste formato:
[
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 100.8
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 7
        },
        "avgMetric" : 98
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-A",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 105
    }
]

Como você pode ver, este é um resultado por array_serial, nome da porta, combinação de ano/mês/data. Você pode usar $sort para colocá-los na ordem em que deseja processá-los a partir daí.

Veja como você estenderia a etapa do projeto para incluir hora e minuto enquanto arredondava minutos para a média a cada cinco minutos:
{
    "$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "hour" : {
            "$hour" : "$DateTime"
        },
        "fmin" : {
            "$subtract" : [
                {
                    "$minute" : "$DateTime"
                },
                {
                    "$mod" : [
                        {
                            "$minute" : "$DateTime"
                        },
                        5
                    ]
                }
            ]
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
}

Espero que você possa estender isso aos seus dados e requisitos específicos.