As pesquisas de texto completo em linguagem natural do MySQL visam combinar consultas de pesquisa com um corpus para encontrar as correspondências mais relevantes. Então suponha que temos um artigo que contém "I love pie" e temos os documentos d1, d2, d3 (o banco de dados no seu caso). Os documentos 1 e 2 são sobre esportes e religião, respectivamente, e o documento 3 é sobre alimentação. Sua pergunta,
Retornará d3 e depois d2, d1 (ordem aleatória de d2,d1 dependendo de qual for mais igual ao artigo) porque d3 corresponde melhor ao artigo.
O algoritmo subjacente que o MYSQL usa é provavelmente o algoritmo tf-idf, onde tf significa frequência de termo e idf para frequência de documento inversa. tf é como diz, apenas o número de vezes que uma palavra w no artigo ocorre em um documento. idf é baseado em quantos documentos a palavra ocorre. Portanto, palavras que ocorrem em muitos documentos não contribuem para decidir o documento mais representativo. O produto de tf*idf produz uma pontuação, quanto maior, melhor a palavra representa um documento. Portanto, 'pie' ocorrerá apenas no documento d3 e, portanto, terá um tf alto e um idf alto (já que é o inverso). Considerando que 'the' terá um tf alto, mas um idf baixo, que causará o tf e dará uma pontuação baixa.
O MYSQL Natural Language Mode também vem com um conjunto de palavras irrelevantes (the, a, some etc) e remove palavras com menos de 4 letras. O que pode ser visto no link que você forneceu.