Para depuração, criei o cenário de teste:
Você deveria ter incluído isso em sua configuração na pergunta.
-- drop schema x CASCADE;
create schema x
create table x.users(id int);
create table x.demographics (user_id int, gender text);
INSERT INTO x.users VALUES (1),(2),(3),(4),(5);
INSERT INTO x.demographics VALUES (1, 'm'),(2, 'f'),(3, 'm'),(4, 'f'),(5, 'm');
Isso funciona agora, depois de algumas correções:
create type x.similarity as (
distance float,
explanation text
);
create or replace function x.similarity_gender(my_gender text, other_gender text)
returns x.similarity as $$
declare
distance float;
sim x.similarity;
begin
if my_gender is null or other_gender is null then
distance = 0.9;
elsif (my_gender = other_gender) then
distance = 0.0;
else
distance = 1.0;
end if;
sim.distance = distance;
sim.explanation = hstore('gender', cast(sim.distance as text));
return sim;
end;
$$ language plpgsql immutable;
create or replace function x.similarity(my_user_id int)
returns table(user_id int, distance float, explanation text) as $$
with factors as (
select u.id as user_id, d.gender
from x.users u
join x.demographics d on u.id = d.user_id),
my_factors as (
select f.user_id, f.gender
from factors f
where f.user_id = $1),
similarities as (
select f.user_id, x.similarity_gender(m.gender, f.gender) AS sim
from factors f, my_factors m)
select s.user_id, (s.sim).distance, (s.sim).explanation
from similarities s;
$$ language sql stable strict;
Ligar:
test=# SELECT * FROM x.similarity(2);
user_id | distance | explanation
---------+----------+---------------
1 | 1 | "gender"=>"1"
2 | 0 | "gender"=>"0"
3 | 1 | "gender"=>"1"
4 | 0 | "gender"=>"0"
5 | 1 | "gender"=>"1"
Pontos principais
- Crie a função primeiro, você tem a sequência de execução revertida em sua configuração
- Na semelhança de função, você deve qualificar os nomes das colunas para evitar conflitos de nome com os parâmetros OUT do mesmo nome (
user_id
,distance
,explanation
). - Suas semelhanças CTE foram mutiladas. Eu puxei a chamada de função similarity_gender(..) para a lista SELECT. Para não ligar duas vezes, divido na próxima etapa.
- Use parênteses para acessar os campos de tipos compostos. Consulte o manual fino aqui .
- O tipo de retorno da função similarity() tinha um bug:
explanation hstore
. Deve serexplanation text
.