Mysql
 sql >> Base de Dados >  >> RDS >> Mysql

Explicação do SQL do Wordnet


WordNet é um banco de dados de palavras super legal. Eu mesmo tenho pesquisado. Vou listar minhas descobertas abaixo - e espero que ajude você a entender melhor as tabelas.

A tabela Synset A tabela synsets é uma das tabelas mais importantes do banco de dados. Ele é responsável por abrigar todas as definições dentro do WordNet. Cada linha na tabela synset tem um synsetid, uma definição, um pos (campo de partes de fala) e um lexdomainid (que se vincula à tabela lexdomain) Existem 117373 synsets no banco de dados WordNet.

A tabela de palavras O WordNet também possui uma tabela de “palavras”, que possui apenas dois campos:um wordid e um “lema”. A tabela de palavras é responsável por abrigar todos os lemas (palavras de base) dentro do banco de dados Wordnet. Existem 146625 entradas nesta tabela

Então... como essas duas tabelas estão ligadas? A resposta? A mesa dos sentidos!

A Tabela de Sentidos A tabela de sentido é responsável por ligar palavras (na tabela de palavras), com definições (na tabela de synset). é um significado completo de uma palavra - um “sentido da palavra”.
Há um total de 206.354 sentidos de palavras no banco de dados WordNet.

A tabela Lexdomains A tabela Lexdomains é referenciada pela tabela de sentido e é usada para definir a qual domínio lexical um par palavra-sentido pertence. Existem 45 domínios lexicais na tabela lexdomains. Portanto, a tabela lexdomain é a maneira do WordNet de “marcar” um par palavra-sentido. No entanto, é bastante limitado, pois um par palavra-sentido só pode pertencer a UM domínio lexical.

Os 45 domínios lexicais incluem:

Adjetivos: tudo, pert

Advérbios tudo

Substantivos tops, ato, animal, artefato, atributo, corpo, cognição, comunicação, evento, sentimento, comida, grupo, localização, motivo, objeto, pessoa, fenômeno, planta, posse, processo, quantidade, linkdef, forma, estado, substância, Tempo,

Verbos corpo, mudança, cognição, comunicação, competição, consumo, contato, criação, emoção, movimento, percepção, posse, social, estativo, clima, ppl

A tabela de palavras-chave Algumas palavras dentro da tabela de palavras naturalmente têm a primeira letra maiúscula, ou seja:“A-team”. Como a tabela de palavras armazena todas as palavras em letras minúsculas, o WordNet usa essa tabela para especificar a versão em maiúsculas da palavra. Há 40.313 entradas nesta tabela.

Existem muitas outras tabelas no banco de dados WordNet, assim que eu tiver pesquisado, postarei novamente.

Encontrando seus sinônimos Para responder à sua pergunta sobre sinônimos - Você precisa fazer o seguinte.

Digamos que você queira encontrar os sinônimos para a palavra "Carry". Para fazer isso, primeiro você deve pesquisar na tabela de palavras um lema que corresponda à palavra "carry". Isso produziria o ID da palavra 21253. Você então pesquisaria a tabela de sentidos para encontrar todos os pares de sentido de palavra para a palavra transportar. Isso produz 41 resultados - cada resultado lista o wordid 21253 e um senseid (que é o índice do par palavra-sentido) e um synsetid.

Agora, você precisaria consultar a tabela synset para cada um dos synsetids retornados para poder acessar o campo de definição associado na tabela synset.

Por fim, para encontrar os sinônimos para cada um dos synsets listados, basta pesquisar na tabela de sentido por outros pares de sentido de palavra que compartilham o mesmo synset.

Exemplo:Um dos 41 pares de sentido de palavra para a palavra "carry" está listado abaixo:Se procurarmos a definição para este synsetid 202083512, você encontrará “transmitir ou servir como meio de transmissão”

Para encontrar todos os sinônimos para esta definição, você deve pesquisar a tabela de sentido pelo mesmo synsetid 202083512. Isso produz sinônimos:canal, conduta, transmissão, transmissão e transmissão (observação:você precisará unir a tabela de palavras à esquerda para obter os lemas reais)

Espero que isso ajude a desmistificar o WordNet para você.. Estou achando bem legal...