PostgreSQL
 sql >> Base de Dados >  >> RDS >> PostgreSQL

PostgreSQL para XML com 3 tabelas


Você tem três níveis de tabelas aninhadas.

Dados de amostra:

CREATE TABLE a(
  a_id integer primary key,
  name text
);

CREATE TABLE b(
  b_id integer primary key,
  a_id integer references a(a_id),
  val text
);

CREATE TABLE c(
  c_id serial primary key,
  b_id integer references b(b_id),
  blah text
);

INSERT INTO a(a_id, name) VALUES (1, 'fred'),(2, 'bert');

INSERT INTO b(b_id, a_id, val) VALUES 
(11, 1, 'x'), (12, 1, 'y'), (21, 2, 'a'), (22, 2, 'b');

INSERT INTO c(b_id, blah) VALUES
(11, 'whatever'), (11, 'gah'), (12, 'borkbork'), (22, 'fuzz');

Método 1:faça uma junção à esquerda, manipule XML no cliente


A maneira mais simples de lidar com isso é fazer uma junção à esquerda em todas as três tabelas, ordenadas da mais externa para a mais interna. Em seguida, você itera o conjunto de resultados, fechando um elemento e abrindo outro sempre que o assunto nesse nível mudar.
select *
from a left join b on (a.a_id = b.a_id)
       left join c on (b.b_id = c.b_id)
order by a.a_id, b.b_id, c.c_id;

em seguida, faça um loop sobre as linhas retornadas e, para cada linha, pseudocódigo :
cur_row = get_new_row()

if (cur_row[b_id] != prev_row[b_id]) {
   emit_close_tableb();
}
if (cur_row[a_id] != prev_row[a_id]) {
   emit_close_tablea();
   emit_open_tablea(cur_row);
}
if (cur_row[b_id] != prev_row[b_id]) {
   emit_open_tableb(cur_row);
}
emit_tablec(cur_row);

prev_row = cur_row;

Para escrever o XML, você usaria algo como XMLWriter . Para ler os dados da consulta, você pode usar algo como PDO ou qualquer driver que preferir. Se o conjunto de dados for grande, considere usar um cursor para ler os dados.

Isso funciona bem, mas transfere muito muito de dados em excesso, já que você transfere n cópias dos dados da tabela externa para cada n linhas da tabela interna associada a ela.

Para reduzir o excesso de dados trocados, você pode selecionar apenas os IDs para as tabelas externas
select a.a_id, b.b_id, c.*
from a left join b on (a.a_id = b.a_id)
       left join c on (b.b_id = c.b_id)
order by a.a_id, b.b_id, c.c_id;

... então, quando você alterna para uma nova tabelaa / tabelab, SELECT o resto de suas linhas então. Você provavelmente usará uma segunda conexão para fazer isso para não atrapalhar o conjunto de resultados e o estado do cursor na conexão principal da qual você está lendo as linhas.

Método 2:Faça tudo no PostgreSQL


Para conjuntos de dados menores, ou para os níveis internos de conjuntos de dados maiores, você pode usar o suporte XML do PostgreSQL para construir os documentos XML, por exemplo:
WITH xmlinput AS (
  SELECT a, b, c
  FROM a
  LEFT JOIN b ON (a.a_id = b.a_id)
  LEFT JOIN c on (b.b_id = c.b_id)
  ORDER BY a.a_id, b.b_id, c.c_id
)
SELECT
  XMLELEMENT(name items,
    xmlagg(
      XMLELEMENT(name a,
        XMLFOREST((a).a_id AS a_id, (a)."name" AS name),
        b_xml
      )
    ORDER BY (a).a_id)
  ) AS output
FROM
(
  SELECT
    a,
    xmlagg(
      XMLELEMENT(name b,
        XMLFOREST((b).b_id AS b_id, (b).val AS val),
        c_xml
      )
    ORDER BY (b).b_id)
    AS b_xml
  FROM
  (
    SELECT
      a, b,
      xmlagg(
        XMLELEMENT(name c,
          XMLFOREST((c).c_id AS c_id, (c).blah AS blah)
        )
      ORDER BY (c).c_id)
      AS c_xml
    FROM xmlinput
    GROUP BY a, b
  ) c_as_xml
  GROUP BY a
) b_as_xml;

... mas realmente, você tem que ser algum tipo de masoquista para escrever um código assim. Embora possa provar ser bastante rápido.

Para entender a consulta você precisará ler os documentos XML do PostgreSQL . A sintaxe maluca foi inventada pelo comitê SQL/XML, não nos culpe.

Observe também que variáveis ​​de linha são muito usados ​​no código acima para mantê-lo organizado. a , b e c são passados ​​como linhas inteiras para camadas externas da consulta. Isso evita a necessidade de mexer com aliases quando os nomes colidem. A sintaxe (a).a_id , etc, significa "o a_id campo da variável de linha a ". Veja o manual do PostgreSQL para detalhes.

O acima usa uma estrutura XML melhor (veja os comentários abaixo). Se você deseja emitir atributos e não elementos, você pode alterar o XMLFOREST chamadas para XMLATTRIBUTES chamadas.

Resultado:
<items><a><a_id>1</a_id><name>fred</name><b><b_id>11</b_id><val>x</val><c><c_id>1</c_id><blah>whatever</blah></c><c><c_id>2</c_id><blah>gah</blah></c></b><b><b_id>12</b_id><val>y</val><c><c_id>3</c_id><blah>borkbork</blah></c></b></a><a><a_id>2</a_id><name>bert</name><b><b_id>21</b_id><val>a</val><c/></b><b><b_id>22</b_id><val>b</val><c><c_id>4</c_id><blah>fuzz</blah></c></b></a></items>

ou, bem impresso:
<?xml version="1.0" encoding="utf-16"?>
<items>
    <a>
        <a_id>1</a_id>
        <name>fred</name>
        <b>
            <b_id>11</b_id>
            <val>x</val>
            <c>
                <c_id>1</c_id>
                <blah>whatever</blah>
            </c>
            <c>
                <c_id>2</c_id>
                <blah>gah</blah>
            </c>
        </b>
        <b>
            <b_id>12</b_id>
            <val>y</val>
            <c>
                <c_id>3</c_id>
                <blah>borkbork</blah>
            </c>
        </b>
    </a>
    <a>
        <a_id>2</a_id>
        <name>bert</name>
        <b>
            <b_id>21</b_id>
            <val>a</val>
            <c />
        </b>
        <b>
            <b_id>22</b_id>
            <val>b</val>
            <c>
                <c_id>4</c_id>
                <blah>fuzz</blah>
            </c>
        </b>
    </a>
</items>

Por favor, emita um XML melhor


Em uma nota lateral, usar atributos como esse em XML parece tentador, mas rapidamente fica difícil e feio de trabalhar. Por favor, use apenas elementos XML normais:
  <Table 1>
    <Nr>1</Nr>
    <Name>blah</Name>
     <Table 2>
       <Nr>1</Nr>
       <Table 3>
          <Col1>42</Col1>
          <Col2>...</Col2>
          <Col3>...</Col3>
          <Col4>...</Col4>
          ...
       </Table 3>
     </Table 2>
   </Table 1>