Database
 sql >> Base de Dados >  >> RDS >> Database

Conteúdo não estruturado:uma fonte de combustível inexplorada para IA e aprendizado de máquina


Por Alex Welsh , Vice-presidente, Prática de análise, Ephesoft

Você escolheria para onde ir nas férias se pudesse acessar apenas 10 a 20 por cento das avaliações e informações em um site de viagens? Se o fizer, provavelmente terá uma viagem inesquecível, mas por motivos que talvez não goste. No entanto, organizações e empresas governamentais - de manufatura a companhias de seguros, de assistência médica a bancos - estão tomando decisões nessa mesma linha. E eles fazem isso há anos. Eles analisam as informações fáceis que podem obter de dados estruturados enquanto ignoram seus dados não estruturados, que a Deloitte acredita que podem representar 80 a 90 por cento do conteúdo gerado globalmente, tornando os dados não estruturados uma tremenda fonte de valor inexplorado.

Felizmente, os avanços em IA (Inteligência Artificial) e aprendizado de máquina agora tornam possível e acessível filtrar e encontrar significado em grandes quantidades de dados não estruturados obtidos de arquivos de vídeo e áudio, e-mails, logs, postagens de mídia social e até notificações de dispositivos da Internet das Coisas (IoT). Todos esses dados podem trazer enormes benefícios, como quando usados ​​para automatizar tarefas manualmente intensivas e muitas vezes altamente repetitivas. Uma tarefa, por exemplo, é ficar atento aos sinais de alerta:critérios ou comportamentos específicos que podem indicar que algo está errado e ações corretivas devem ser tomadas rapidamente. Vejamos alguns casos de diferentes setores.

Que tal uma reclamação de seguro que parece boa à primeira vista, mas merece ser investigada, ou um candidato a emprego que pode estar escondendo informações? E quanto a uma remessa de produtos farmacêuticos altamente perecíveis que podem não ter sido refrigerados por uma parte de sua jornada, ou um contrato que pode violar as leis de um país ou quebrar um acordo existente com outra empresa? O importante é que uma bandeira vermelha indica problemas que, se não forem controlados, podem causar grandes danos.

Inteligência Artificial é Massivamente Faminta de Dados


Como a IA e o aprendizado de máquina permitem uma análise de dados mais eficiente e eficaz? Através da alimentação de dados. Ao dar a um modelo de aprendizado de máquina exemplos de transações boas e ruins, ele aprende a distinguir entre os dois tipos. E, quanto mais dados o modelo de aprendizado de máquina processa, mais ele reforça essas lições, aumentando a precisão.

Portanto, embora a IA e o aprendizado de máquina estejam avançando a passos largos, as empresas e outras organizações precisam se atualizar. Pense desta forma:dados são como combustível. Precisamos dele para alimentar nosso pensamento para tomar decisões sábias. Mas, nós extraímos todas as coisas fáceis, os dados estruturados que chegam em pacotes bonitos e organizados. Mas, aqui é onde a analogia do combustível se desfaz:mesmo que outro galão de gasolina nos permita dirigir mais 20 a 30 milhas, quanto mais dados colocamos nos permite tomar decisões significativamente melhores e mais precisas - não apenas mais 20 a 30 - milhas que valem a pena - e para torná-las ainda mais rápidas.

No entanto, por tanto tempo, uma enorme parte de nossos dados, nossos dados não estruturados, permaneceu inexplorado porque era muito caro e muito difícil de acessar e processar. E, embora esse não seja mais o caso à medida que novas tecnologias para coletar e analisar dados não estruturados se tornam disponíveis, muitas pessoas nos negócios e em outras organizações ignoraram esses avanços.

Onde está o dinheiro inteligente


A International Data Corporation (IDC) prevê que, até 2020, as organizações que analisam dados estruturados e não estruturados – ou seja, todos os dados relevantes – e fornecem informações acionáveis ​​alcançarão US$ 430 bilhões extras em ganhos de produtividade em relação aos concorrentes que não realizam essa análise de dados. E as empresas que entendem isso não esperam até 2020. Um executivo de uma seguradora multinacional com sede na Alemanha refere-se aos dados não estruturados como seu maior risco. Eles entendem os números envolvidos e estão trabalhando para garantir que não sejam pegos de surpresa escrevendo apólices de seguro que os expõem a responsabilidades que poderiam ter evitado.

O poder combinado de big data, IA e aprendizado de máquina pode facilitar o processamento de informações relacionadas a desafios ainda mais complexos. Por exemplo, bancos e outras organizações podem detectar fraudes, evasão fiscal, lavagem de dinheiro e outros esquemas com mais precisão e rapidez, extraindo dados não processados ​​e não estruturados anteriormente. Isso permite que eles detectem e encerrem casos de fraude e abuso, além de evitar os muitos falsos positivos que podem ocorrer ao confiar apenas em dados estruturados. Acordos de financiamento comercial, incluindo contratos e várias fontes de dados, entre países ou empresas também podem ser examinados para determinar se existem fraudes ou desigualdades, sejam elas intencionais ou não.

Além disso, a IA e o aprendizado de máquina podem ajudar os bancos e outros tipos de empresas a identificar e verificar melhor a identidade de seus clientes por meio de procedimentos automatizados de Know Your Customer (KYC). Esses procedimentos podem ajudar a evitar que sejam usados, deliberada ou inadvertidamente, para atividades de lavagem de dinheiro, bem como ajudar a evitar a ocorrência de suborno e outras formas de corrupção. Os procedimentos de KYC também podem permitir que as empresas entendam melhor as transações e necessidades financeiras de seus clientes, além de ajudá-los a gerenciar os riscos com mais prudência. Outras vantagens incluem acelerar o tempo de receita ao integrar novos clientes, tornando o KYC não mais um custo a ser incorrido, mas uma fonte de lucro.

IA e aprendizado de máquina podem aumentar sua competitividade


Com todos os benefícios obtidos por meio de IA e aprendizado de máquina – e os avanços na tecnologia usada para processar dados estruturados e não estruturados – é hora de mais empresas e organizações aproveitarem a maior fonte de informação disponível:seus próprios dados não estruturados.

Sobre o autor


Alex Welsh lidera a prática global de análise da Ephesoft. Ele é um experiente diretor de vendas, gerente de projetos e empresário com paixão por resolver os problemas de missão crítica dos clientes com soluções tecnológicas inovadoras e econômicas.