Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Contar o número de linhas que não estão dentro de 10 segundos uma da outra


Deixe-me começar com esta tabela. Usarei carimbos de data e hora comuns para que possamos ver facilmente o que está acontecendo.
180.2.79.3   2011-01-01 08:00:00
180.2.79.3   2011-01-01 08:00:09
180.2.79.3   2011-01-01 08:00:20
180.2.79.3   2011-01-01 08:00:23
180.2.79.3   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:40
180.2.79.4   2011-01-01 08:00:00
180.2.79.4   2011-01-01 08:00:13
180.2.79.4   2011-01-01 08:00:23
180.2.79.4   2011-01-01 08:00:25
180.2.79.4   2011-01-01 08:00:27
180.2.79.4   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:50

Se eu entendi corretamente, você quer contá-los assim.
180.2.79.3   3
180.2.79.4   3

Você pode fazer isso para cada ip_address selecionando o timestamp máximo que é tanto
  • maior que o carimbo de data/hora da linha atual e
  • menor ou igual a 10 segundos a mais que o carimbo de data/hora da linha atual.

Juntar esses dois critérios introduzirá alguns nulos, que acabam sendo muito úteis.
select ip_address, 
       t_s.time_stamp, 
       (select max(t.time_stamp) 
        from t_s t 
        where t.ip_address = t_s.ip_address 
          and t.time_stamp > t_s.time_stamp
          and t.time_stamp - t_s.time_stamp <= interval '10' second) next_page
from t_s 
group by ip_address, t_s.time_stamp
order by ip_address, t_s.time_stamp;

ip_address   time_stamp            next_page
180.2.79.3   2011-01-01 08:00:00   2011-01-01 08:00:09
180.2.79.3   2011-01-01 08:00:09   <null>
180.2.79.3   2011-01-01 08:00:20   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:23   2011-01-01 08:00:25
180.2.79.3   2011-01-01 08:00:25   <null>
180.2.79.3   2011-01-01 08:00:40   <null>
180.2.79.4   2011-01-01 08:00:00   <null>
180.2.79.4   2011-01-01 08:00:13   2011-01-01 08:00:23
180.2.79.4   2011-01-01 08:00:23   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:25   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:27   2011-01-01 08:00:29
180.2.79.4   2011-01-01 08:00:29   <null>
180.2.79.4   2011-01-01 08:00:50   <null>

O carimbo de data/hora que marca o fim de uma visita tem um valor nulo para sua própria next_page. Isso porque nenhum timestamp é menor ou igual a time_stamp + 10 segundos para essa linha.

Para obter uma contagem, eu provavelmente criaria uma visualização e contaria os nulos.
select ip_address, count(*)
from t_s_visits 
where next_page is null
group by ip_address

180.2.79.3   3
180.2.79.4   3