Кто-нибудь знает, есть ли список немецких слов, используемых в полнотекстовом средстве разбиения слов?

Полнотекстовый поиск SQL Server использует средства разбиения слов для конкретных языков.

В немецком языке это используется для разрыва/разделения слов, включая составные слова. Однако оказывается, что не все известные составные слова включены в Word Breaker. Я хотел бы знать, доступен ли список слов, о которых знает Word Breaker.


person Coolcoder    schedule 03.12.2008    source источник


Ответы (2)


в sql server 2008 это работает... Language_id, который я здесь указал, предназначен для немецкого языка. Я хотел увидеть то же самое, но на испанском языке.

SELECT * FROM sys.fulltext_system_stopwords
WHERE language_id = 1031

редактировать: в sql server 2005 слова хранятся здесь "$SQL_Server_Install_Path\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\", если вы редактируете файл шумовых слов, вам необходимо повторно заполнить полный текст.

person Alan Featherston    schedule 03.12.2008
comment
Стоп-слова — это новые пропускаемые слова в 2008 году. По сути, это слова, которые исключаются из полнотекстового поиска. Я хочу знать, какими словами Full Text умеет расставаться. - person Coolcoder; 03.12.2008
comment
В частности, в немецком языке есть составные слова — Word Breaker, похоже, разбивает одни слова, но не другие. Поэтому я хотел бы знать, какие слова он знает. - person Coolcoder; 03.12.2008

Ответ - нет ответа. По словам Microsoft, слова не сохраняются — они используют формулу, чтобы «сломать» их. Это никогда не будет на 100% точным, поэтому мне просто придется жить с этим фактом.

person Coolcoder    schedule 29.01.2009