Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Maneira simples de calcular a mediana com o MySQL


Em MariaDB/MySQL:
SELECT AVG(dd.val) as median_val
FROM (
SELECT d.val, @rownum:[email protected]+1 as `row_number`, @total_rows:[email protected]
  FROM data d, (SELECT @rownum:=0) r
  WHERE d.val is NOT NULL
  -- put some where clause here
  ORDER BY d.val
) as dd
WHERE dd.row_number IN ( FLOOR((@total_rows+1)/2), FLOOR((@total_rows+2)/2) );

Steve Cohen ressalta que, após a primeira passagem, @rownum conterá o número total de linhas. Isso pode ser usado para determinar a mediana, portanto, nenhuma segunda passagem ou junção é necessária.

Também AVG(dd.val) e dd.row_number IN(...) é usado para produzir corretamente uma mediana quando há um número par de registros. Raciocínio:
SELECT FLOOR((3+1)/2),FLOOR((3+2)/2); -- when total_rows is 3, avg rows 2 and 2
SELECT FLOOR((4+1)/2),FLOOR((4+2)/2); -- when total_rows is 4, avg rows 2 and 3

Por fim, MariaDB 10.3.3+ contém uma função MEDIAN