Database
 sql >> Base de Dados >  >> RDS >> Database

Usando dados ODBC no RapidMiner


A distribuição RapidMiner inclui um conector genérico que permite que conjuntos de dados sejam construídos a partir de qualquer banco de dados para o qual um driver ODBC esteja disponível. O conector é chamado de Ponte JDBC-ODBC e é parte integrante do Java 1.7 e anteriores. As implicações disso são:
  • A versão 1.8 e versões posteriores do Java não incluem a ponte nativa JDBC-ODBC.
  • A ponte nativa está incluída em um arquivo Java Archive principal e não pode ser separada da distribuição Java que a acompanha.

Se você precisar conectar o RapidMiner a um driver ODBC de 32 bits, use o Easysoft JDBC-ODBC Bridge. O Easysoft JDBC-ODBC Bridge possui um componente Java e um componente nativo de 32 bits. Ele é totalmente suportado pela Easysoft e atualmente está sendo implantado em ambientes de produção em todo o mundo.

Você precisa usar a versão Professional do RapidMiner para usar drivers de terceiros, como o Easysoft JDBC-ODBC Bridge com ele. Uma versão de avaliação do RapidMiner Professional está disponível para usuários que criam uma conta no site do RapidMiner.

Se você ainda não possui o RapidMiner Professional, siga estas etapas:
  1. Crie uma conta RapidMiner e verifique o endereço de e-mail fornecido ao criar a conta.
  2. Faça o download do RapidMiner Studio para sua plataforma Windows.
  3. Inicie o RapidMiner e faça login quando solicitado.
    Seu período de avaliação do RapidMiner Professional já começou.

Para conectar o RapidMiner a alguns dados ODBC:
  1. Configure uma fonte de dados ODBC do sistema para o banco de dados ao qual você deseja se conectar no RapidMiner.
    Para fazer isso, use a versão de 32 bits do ODBC Data Source Administrator em sua máquina RapidMiner. Em algumas versões do Windows, isso está localizado em Painel de Controle> Ferramentas Administrativas . Em algumas versões do Windows, você precisa procurar ODBC na caixa de pesquisa da barra de tarefas. A versão de 32 bits do ODBC Data Source Administrator deve ser claramente rotulada. Em caso de dúvida, na caixa de diálogo Executar do Windows, digite:
    %windir%\syswow64\odbcad32.exe
    

    Queríamos experimentar o RapidMiner com alguns dados do Microsoft Access e, portanto, criamos uma fonte de dados do driver ODBC do Access que apontava para o banco de dados Northwind.
  2. Baixe a ponte Easysoft JDBC-ODBC. (Registro obrigatório.)
  3. Instale e licencie o Easysoft JDBC-ODBC Bridge na máquina onde o RapidMiner está instalado.
    Para obter instruções de instalação, consulte a documentação do Easysoft JDBC-ODBC Bridge.
  4. No RapidMiner, escolha Conexões> Gerenciar drivers de banco de dados .
    O Gerenciar drivers de banco de dados caixa de diálogo é exibida.
  5. Escolha Adicionar .
  6. Preencha os campos da caixa de diálogo:
    Campo Valor
    Nome Ponte Easysoft JDBC-ODBC
    Prefixo de URL jdbc:easysoft://
    Porta (Deixe em branco)
    Separador de esquema (Deixe em branco)
    Arquivo jar easysoft_install_dir \Jars\EJOB.jar
    No Windows de 64 bits, o local padrão para é :\Program Files (x86)\Easysoft Limited\Easysoft JDBC-ODBC Bridge.

    No Windows de 32 bits, o local padrão para é :\Program Files\Easysoft Limited\Easysoft JDBC-ODBC Bridge.
    Classe JDBC easysoft.sql.jobDriver
  7. Escolha Salvar .
  8. Escolha Conexões> Gerenciar conexões de banco de dados .
    O Gerenciar conexões de banco de dados caixa de diálogo é exibida.
  9. Escolha Novo .
  10. Preencha os campos da caixa de diálogo:
    Campo Valor
    Nome Ponte JDBC-ODBC
    Sistema de banco de dados Ponte Easysoft JDBC-ODBC
    Anfitrião localhost/
    Porta (Deixe em branco)
    Esquema de banco de dados my_odbc_data_source
  11. Escolha Avançado
    As Propriedades de Conexão Avançadas caixa de diálogo é exibida.
  12. Preencha os campos da caixa de diálogo:
    Campo Valor
    usuário de logon my_windows_user
    senha de logon my_windows_password

    Selecione Substituir para esses dois campos.
  13. Use o Teste botão para verificar se você digitou corretamente os detalhes da conexão.

Para analisar os dados ODBC acessíveis por meio do JDBC-ODBC Bridge, crie um novo processo RapidMiner:
  1. Escolha Arquivo> Novo processo .
  2. Escolha um processo em branco quando solicitado.
  3. Usar o Repositório painel para localizar os dados ODBC. Usamos a Ponte JDBC-ODBC para expor alguns dados do Access no banco de dados Northwind:DB> Ponte JDBC-ODBC> Conjuntos de exemplo> Clientes .
  4. Em Design visualização, arraste uma tabela do Repositório painel para o Processo painel. No nosso caso, a tabela era Clientes .
  5. Arraste um Combinação> Valores> Definir dados operador dos Operadores painel para o Processo painel.
  6. Arraste a saída do operador de recuperação para Definir dados operador.
  7. Use o Definir dados guia de parâmetros para alterar um valor de coluna. Por exemplo, alteramos um cargo nos dados de nossos clientes de Representante de vendas para Gerente de Vendas :
    Campo Valor
    Exemplo de índice 1
    Nome do atributo ID do cliente
    Valor ALFKI
    Valores adicionais Editar lista (0) ...> nome do atributo Título do contato
    Editar lista (0) ...> valor Gerente de vendas
  8. Arraste a saída do Definir dados operador ao botão res e escolha Play .
    Os dados modificados são exibidos nos Resultados visualizar.