Sqlserver
 sql >> Base de Dados >  >> RDS >> Sqlserver

Como ignorar tags html na pesquisa de texto completo do Sql Server 2008


há um filtro para arquivos .htm e .html.

para ver se você tem o filtro instalado execute este sql:
SELECT * FROM sys.fulltext_document_types

Você deveria ver:
.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

então, se você pode converter sua coluna de artigos para varbinary(max), então você pode adicionar um índice de texto completo nela e especificar um tipo de documento de '.html'

depois que o índice for preenchido, você poderá verificar as palavras-chave usando este sql:
SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table'))