PostgreSQL
 sql >> Base de Dados >  >> RDS >> PostgreSQL

Detectando linhas com a mesma combinação de números nas duas primeiras colunas e selecionando aquela com o número mais alto na terceira coluna


A ideia é semelhante a esta . Você pode criar duas colunas adicionais usando pmin um pmax agrupar da seguinte forma:

Um data.table solução. Mas se você não quiser data.table, você ainda pode usar a ideia. No entanto, é altamente improvável que você obtenha mais rápido do que a solução data.table com apenas código R.
# assuming your data.frame is DF
require(data.table)
DT <- data.table(DF)
# get min of V1,V2 on one column and max on other (for grouping)
DT[, `:=`(id1=pmin(V1, V2), id2=pmax(V1, V2))]
# get max of V3
DT.OUT <- DT[, .SD[which.max(V3), ], by=list(id1, id2)]
# remove the id1 and id2 columns
DT.OUT[, c("id1", "id2") := NULL]

#     V1  V2     V3
# 1:   2   1    666
# 2: 100 102  23131
# 3:  10  19 124444
# 4:  10  15   1244
# 5: 100 110     23