Intellect Board — cистема управления сайтом

Построение сайта на основе форума

Intellect Board — cистема управления сайтом »   Архив технической поддержки IntB до версии 2.15 »   Вопрос о поиске
RSS

Вопрос о поиске

Выводить сообщения
Правила раздела

<<Назад  Вперед>>Страницы: 1 2
Модераторы: aerograf, wsx
Печать
 
nvl
Новичок


Всего сообщений: 10
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
24 янв. 2006
XXXX Pro
Увы, не знаю, с чем связана моя проблема, поэтому пишу сюда. Точнее, дублирую здесь сообщение с форума "Всероссийское генеалогическое древо", поскольку администратор помочь не может. Итак:
С поиском у меня тоже что-то не в порядке. То есть он работает, но как-то криво.
По запросу "Чебышев" находит 8 сообщений, "Чебышёв" - 2, "Чебышевы" - 4. Но я-то знаю, что их во всех случаях больше.
Например, он должен (или я не прав?) находить все удовлетворяющие запросу сообщения из моей темы "Чебышевы (Чебышёвы), в которой относительно много упоминаний этой фамилии в обоих вариантах и в разных падежах. Но находит очень избирательно, причем принцип отбора непонятен.
Эта тема была выделена из темы "Intellect Board 2.15" (24 января 2006 19:51)
4X_Pro
Руководитель Проекта
Настоящий Компьютерщик
4X_Pro
Откуда: Москва
Всего сообщений: 3299
Рейтинг пользователя: 70


Ссылка


Дата регистрации на форуме:
29 сен. 2001
nvl Вопрос: а в каком режиме производится поиск? Дело в том, что есть режим поиска по сообщениям, и есть режим поиска по заголовкам тем.
Далее: насчет поиска по всем вариантам падежей - вы не правы. Intellect Board сейчас ищет только по точному соответствию написания (исключением является только различие прописных/строчных букв), т.е. "Чебышев" и, например, "Чебышевы" даст совершенно разные результаты. Разработка системы, которая бы анализировала слово и подбирала бы все возможные падежи по трудоемкости реализации превзойдет уже существующие возможности Intellect Board в несколько раз, кроме того, для этого требуются специализированные знания из области лингвистики.

Но вообще, хорошо, что вы подняли данную проблему. Я просмотрел документацию по MySQL и пришел к выводу, что в следующей версии добавлю возможность включения расширенного поиска средствами MySQL, в частности, добавится так называемый "оператор усечения" *, т.е. ввод Чебышев* будет производить поиск всех слов, которые начинаются на Чебышев. (Дело в том, что этого расширенного поиска не имелось в более ранних версиях MySQL, поэтому я не использовал его из соображений достижения максимальной совместимости.)

---
Спорить со мной по поводу того, что в IntB будет, а чего нет -- бесполезно!
nvl
Новичок


Всего сообщений: 10
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
24 янв. 2006
XXXX Pro
С поиском я экспериментировал в разных режимах, но главным образом по сообщениям. И, конечно, боже упаси, не претендовал на анализ падежных форм. Но предполагал, что должен работать "оператор усечения" (как Вы его называете) - как, например, он работает при поиске файлов в Windows (или внутри текстовых файлов в Ворде и других программах), т.е. по любому сочетанию знаков (как отделенных, так и не отделенных пробелами от соседних сочетаний), без использования звездочки. Но если зделаете со звездочкой - тоже хорошо (причем абсолютно необходимо). А когда ждать эту версию с оператором усечения?

Проверил поиск еще раз с учетом Ваших разъяснений - кажется, работает нормально. Но всё же есть, видимо, некоторые некорректности. Поиск по сообщениям:
1) по слову Чебышев найдены также (выделены цветом) Чебышеве и Чебышева" (вместе с кавычками), но не выделено (3 раза, в тех же сообщениях) "Чебышев". Может быть, в последнем случае кавычки повлияли? Но, с другой стороны, если задать поиск по слову вместе с кавычками, он не идет.
2) по слову Чебышёв дважды найдено Чебышёвы, но не найдено "Чебышёв".
nvl
Новичок


Всего сообщений: 10
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
24 янв. 2006
XXXX Pro
Еще одно соображение. Было бы очень полезно при поиске приравнять Ё к Е (но, естественно, не наоборот). Дело в том, что допустимость написания Е вместо Ё - факт русского правописания, и в обозримом будущем это положение не изменится, несмотря на споры и эмоциональные выступления.
4X_Pro
Руководитель Проекта
Настоящий Компьютерщик
4X_Pro
Откуда: Москва
Всего сообщений: 3299
Рейтинг пользователя: 70


Ссылка


Дата регистрации на форуме:
29 сен. 2001
Вообще, на сайте VGD могу попробовать сделать не дожидаясь выхода новой версии, заодно посмотрю, как это на нагрузке скажется. Если делать эту вовзомжность не отключемой из АЦ (как я собираюсь сделать в новой версии), а жестко включенной, то там все сводится к 2 строчкам кода...

---
Спорить со мной по поводу того, что в IntB будет, а чего нет -- бесполезно!
nvl
Новичок


Всего сообщений: 10
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
24 янв. 2006
Это было бы хорошо. Поиск на форуме VGD очень важен, а фамилии во многих случаях приводятся именно в косвенных падежах и множественном числе.
Gram
Администратор

Gram
Откуда: Нижний Новгород
Всего сообщений: 1011
Рейтинг пользователя: 38


Ссылка


Дата регистрации на форуме:
23 июля 2003
Даешь поддержку русской морфологии!
4X_Pro
Руководитель Проекта
Настоящий Компьютерщик
4X_Pro
Откуда: Москва
Всего сообщений: 3299
Рейтинг пользователя: 70


Ссылка


Дата регистрации на форуме:
29 сен. 2001
Ну вот, BOOLEAN MODE на forum.vgd.ru сделал. Теперь можно искать с использованием спецсимволов вида * + -. Вроде на скорость поиска не повлияло. С е/ё будет сложнее, разве что сделать принудительную замену ё на е при отправке сообщения...

---
Спорить со мной по поводу того, что в IntB будет, а чего нет -- бесполезно!
andrey_fisher
Начинающий


Всего сообщений: 46
Рейтинг пользователя: 4

Репутация пользователя: 1

Ссылка


Дата регистрации на форуме:
8 мая 2005
XXXX Pro
думаю, стоит включить эту доработку в остальные проекты и общий дистрибутив.
<<Назад  Вперед>>Страницы: 1 2
Модераторы: aerograf, wsx
Печать
Intellect Board — cистема управления сайтом »   Архив технической поддержки IntB до версии 2.15 »   Вопрос о поиске
RSS

1 посетитель просмотрел эту тему за последние 10 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
Ограничение доступа
не отображаются разделы
Архив версий
Установка стиля на Intellect Board 2.22
Завершилась работа над новой версией 3.00

Самые активные 5 тем RSS


Время выполнения скрипта: 0.1229. Количество выполненных запросов: 17, время выполнения запросов 0.0000
Creative Commons License Rambler's Top100 Rambler's Top100 Рейтинг@Mail.ru Valid HTML 4.01 Transitional Valid CSS!