PostgreSQL 12 vem com um novo recurso chamado colunas geradas . Outros RDBMSs populares já suportam colunas geradas como “colunas computadas” ou “colunas virtuais”. Com o Postgres 12, agora você também pode usá-lo no PostgreSQL. Leia para saber mais.
O que é uma coluna gerada?
Uma coluna gerada é como uma visão, mas para colunas. Aqui está um exemplo básico:
db=# CREATE TABLE t (w real, h real, area real GENERATED ALWAYS AS (w*h) STORED);
CREATE TABLE
db=# INSERT INTO t (w, h) VALUES (10, 20);
INSERT 0 1
db=# SELECT * FROM t;
w | h | area
----+----+------
10 | 20 | 200
(1 row)
db=#
Criamos uma tabela t com duas colunas regulares chamadas w e h , e uma coluna gerada chamada área . O valor da área é calculado no momento da criação e persistido no disco.
O valor das colunas geradas é recalculado quando a linha é atualizada:
db=# UPDATE t SET w=40;
UPDATE 1
db=# SELECT * FROM t;
w | h | area
----+----+------
40 | 20 | 800
(1 row)
db=#
Tal funcionalidade antes era normalmente alcançada com triggers, mas com colunas geradas isso se torna muito mais elegante e limpo.
Alguns pontos que você deve saber sobre as colunas geradas:
- Persistência :Atualmente, o valor das colunas geradas deve ser persistente e não pode ser calculado em tempo real no momento da consulta. A palavra-chave "STORED" deve estar presente na definição da coluna.
- A expressão :A expressão usada para calcular o valor deve serimutável , ou seja, deve ser determinístico. Pode depender de outras colunas, mas não de outras colunas geradas, da tabela.
- Índices :colunas geradas podem ser usadas em índices, mas não como chave de partição para tabelas particionadas.
- Copiar e pg_dump :Os valores das colunas geradas são omitidos na saída dos comandos “pg_dump” e “COPY table”, por ser desnecessário. Você pode incluí-los explicitamente em COPY usando
COPY (SELECT * FROM t) TO STDOUT
em vez deCOPY t TO STDOUT
.
Um exemplo prático
Vamos adicionar suporte de pesquisa de texto completo a uma tabela usando colunas geradas. Aqui está uma tabela que armazena todo o texto de todas as peças de Shakespeare:
CREATE TABLE scenes (
workid text, -- denotes the name of the play (like "macbeth")
act integer, -- the act (like 1)
scene integer, -- the scene within the act (like 7)
description text, -- short desc of the scene (like "Macbeth's castle.")
body text -- full text of the scene
);
Veja como os dados ficam:
shakespeare=# SELECT workid, act, scene, description, left(body, 200) AS body_start
shakespeare-# FROM scenes WHERE workid='macbeth' AND act=1 AND scene=1;
workid | act | scene | description | body_start
---------+-----+-------+-----------------+----------------------------------------------
macbeth | 1 | 1 | A desert place. | [Thunder and lightning. Enter three Witches]+
| | | | +
| | | | First Witch: When shall we three meet again +
| | | | In thunder, lightning, or in rain? +
| | | | +
| | | | Second Witch: When the hurlyburly's done, +
| | | | When the battle's lost and won. +
| | | |
(1 row)
Adicionaremos uma coluna que conterá os lexemas no valor de “body”. A função to_tsvector retorna os lexemas que precisamos:
shakespeare=# SELECT to_tsvector('english', 'move moving moved movable mover movability');
to_tsvector
-------------------------------------
'movabl':4,6 'move':1,2,3 'mover':5
(1 row)
O tipo do valor retornado por
to_tsvector
é tsvetor. Vamos alterar a tabela para adicionar uma coluna gerada:
ALTER TABLE scenes
ADD tsv tsvector
GENERATED ALWAYS AS (to_tsvector('english', body)) STORED;
Você pode ver a alteração com
\d
:shakespeare=# \d scenes
Table "public.scenes"
Column | Type | Collation | Nullable | Default
-------------+----------+-----------+----------+----------------------------------------------------------------------
workid | text | | not null |
act | integer | | not null |
scene | integer | | not null |
description | text | | |
body | text | | |
tsv | tsvector | | | generated always as (to_tsvector('english'::regconfig, body)) stored
Indexes:
"scenes_pkey" PRIMARY KEY, btree (workid, act, scene)
E assim, agora você pode fazer pesquisas de texto completo:
shakespeare=# SELECT
workid, act, scene, ts_headline(body, q)
FROM (
SELECT
workid, act, scene, body, ts_rank(tsv, q) as rank, q
FROM
scenes, plainto_tsquery('uneasy head') q
WHERE
tsv @@ q
ORDER BY
rank DESC
LIMIT
5
) p
ORDER BY
rank DESC;
workid | act | scene | ts_headline
----------+-----+-------+-----------------------------------------------------------
henry4p2 | 3 | 1 | <b>Uneasy</b> lies the <b>head</b> that wears a crown. +
| | | +
| | | Enter WARWICK and Surrey +
| | | +
| | | Earl of Warwick
henry5 | 2 | 2 | <b>head</b> assembled them? +
| | | +
| | | Lord Scroop: No doubt, my liege, if each man do his best.+
| | | +
| | | Henry V: I doubt not that; since we are well persuaded +
| | | We carry not a heart with us from hence
(2 rows)
shakespeare=#
Leia mais
Se você tiver necessidade de dados pré-computados / “em cache”, especialmente com uma carga de trabalho de poucas gravações e muitas leituras, as colunas geradas devem ajudar a simplificar muito o código do seu aplicativo/servidor.
Você pode ler a documentação v12 de CREATE TABLE e ALTER TABLE para ver a sintaxe atualizada.