Database
 sql >> Base de Dados >  >> RDS >> Database

Subconjunto de banco de dados - Como fazer no IRI Voracity


Quando um banco de dados excede um determinado tamanho, torna-se caro — e arriscado do ponto de vista da segurança — fornecer cópias em tamanho real para desenvolvimento, teste e treinamento. A maioria das equipes precisa de cópias menores do banco de dados maior e geralmente têm as PII mascaradas.

O subconjunto de banco de dados é o processo de criação de uma cópia menor e referencialmente correta de um banco de dados maior a partir de extratos de tabelas reais. Os subconjuntos podem ser usados ​​com, ou em vez de, mascarar dados ou sintetizar dados de teste para reduzir os custos e riscos associados aos conjuntos completos. O processo de criação manual de subconjuntos significativos é complexo e trabalhoso, considerando que você teria que preencher bancos de dados menores com amostras aleatórias de cada tabela de produção e certificar-se de que qualquer estrutura relacional entre as tabelas ainda estivesse correta no subconjunto.

Um assistente de trabalho de subconjunto de banco de dados de ponta a ponta no IRI Workbench torna esse processo mais rápido e fácil. O assistente está disponível para usuários licenciados da plataforma de gerenciamento de dados IRI Voracity, IRI RowGen para geração de dados de teste e IRI FieldShield para mascaramento de dados. Este artigo apresenta o assistente e mostra como ele cria subconjuntos referencialmente corretos, com opções para mascaramento de coluna e criptografia com preservação de campo.

O assistente para criação de subconjunto faz com que o usuário selecione a origem do subconjunto, o tamanho e a classificação dele, os nomes para os destinos do subconjunto e qualquer criptografia ou mascaramento que os dados do subconjunto devem obter. O assistente cria uma série de scripts de tarefa que criam tabelas de subconjunto ou arquivos simples.

Opções de trabalho


Esta página define o tipo de saída. Se o carregador for deixado vazio, um arquivo simples com um delimitador de tabulação será criado. Para opções de banco de dados, o ODBC ou o carregador de banco de dados específico pode ser selecionado.


Opções de subconjunto


Esta página é onde você especifica os detalhes do subconjunto. Selecione o perfil de conexão e a tabela que irá “dirigir” o subconjunto criado. Pense na tabela de direção como a tabela principal de onde você deseja que o subconjunto se origine. Por exemplo, se você deseja dividir uma tabela de vendas e todas as tabelas conectadas a ela, selecione a tabela com informações de vendas aqui. Além disso, selecione o tamanho do subconjunto. Por exemplo, para obter um subconjunto das 100 maiores quantidades vendidas, você classificaria no campo quantidade vendida (como neste exemplo) e inseriria 100 no número de linhas. Um filtro também pode ser adicionado na tabela de drivers.


Classificação


Esta página é onde você especifica a ordem de classificação do subconjunto. No entanto, se você quiser que as linhas sejam selecionadas aleatoriamente, deixe a lista Campos-chave em branco.

A página Classificar tem 3 seções notáveis:
  1. A lista de campos de entrada
  2. A lista de campos-chave
  3. Opções principais



Passos:
  1. Se você quiser um subconjunto de dados classificados, selecione a coluna para classificar e clique em "Adicionar chave".
  2. Algumas opções estão disponíveis na caixa Opções de chave:
    • Selecione a caixa de seleção Estável para duplicar registros a serem carregados na ordem em que estão na tabela de produção.
    • Se você não quiser duplicatas ou apenas duplicatas em seu subconjunto, marque a caixa de seleção Duplicatas e o botão de opção apropriado.

Nomeação do destino


Esta página é exibida se o tipo de saída for um banco de dados. Tem duas funções. O primeiro permite que você visualize as relações da sua tabela de drivers. A segunda é nomear os destinos de saída para o subconjunto.

A página Target Naming tem 5 seções notáveis:
  1. O perfil e o esquema de destino
  2. O modo de saída é sempre criar, pois este trabalho truncará todas as tabelas existentes com o mesmo nome
  3. Opções SQL para o trabalho
  4. As opções de nomenclatura
  5. A lista de referências



Passos:
  1. Selecione o perfil de conexão.
  2. Selecione o esquema.
  3. Especifique as opções de SQL.
  4. Selecione a opção de nomenclatura para nomear os destinos de subconjunto. Se um perfil ou esquema diferente for usado, esta etapa é opcional:
    • Prefixo tudo adiciona um prefixo a cada nome de tabela e o define como o destino dessa tabela.
    • Corrigir tudo adiciona um postfix a cada nome de tabela e o define como o destino dessa tabela.
    • Nomear individualmente permite que cada destino de subconjunto seja nomeado independentemente dos outros destinos.
  5. Revise o Referenciado porReferências  listas para verificar se as relações da tabela foram encontradas corretamente:
    • No Importado por  list, todas as tabelas pelas quais sua tabela escolhida é importada são listadas.
    • Nas Importações list, todas as tabelas com as quais sua tabela escolhida tem um relacionamento são listadas.

Regras


Nesta página, as regras podem ser adicionadas a qualquer um dos destinos. Neste exemplo, um correspondente de regra foi adicionado a todos os campos que terminam com a palavra “NAME”. A regra será aplicada à tabela de destino correspondente. Essa regra mascarará esses dois campos com asteriscos. Deve-se tomar cuidado para não incluir regras em campos de chave estrangeira.


Resumo


Esta página resume o trabalho. Ele exibe claramente as colunas que correspondem a uma regra e as tabelas de destino que correspondem às tabelas de origem, se elas não existirem. Observe que o DDL será criado para todas as novas tabelas.



Depois que todas essas páginas forem concluídas, você poderá selecionar Concluir. O assistente criará scripts de tarefa e um arquivo em lote executável para Windows ou Unix que você pode iniciar no Workbench ou na linha de comando para extrair subconjuntos da tabela de driver e suas tabelas relacionadas.

Aqui está um diagrama de fluxo mostrando essas oito tarefas criadas para o trabalho no Voracity:


Entre em contato com [email protected] se tiver alguma dúvida.