Intellect Board — cистема управления сайтом

Построение сайта на основе форума

Intellect Board — cистема управления сайтом »   Техническая поддержка версии 2.22 »   Проблема повторяющихся страниц
RSS

Проблема повторяющихся страниц

Надо их убрать, чтобы поисковых ботов не раздражало.

Текущий рейтинг темы: Нет
Выводить сообщения

<<Назад  Вперед>>Модераторы: aerograf, wsxПечать
 
Dearheart
Почетный участник


Откуда: Нижний Новгород
Всего сообщений: 130
Рейтинг пользователя: 4


Ссылка


Дата регистрации на форуме:
27 дек. 2007
У нас на форуме при включенных HURL каждая страница может вызываться в двух, а то и в трёх видах. Например главная страница отзывается по адресам:
мой_домен.ру
мой_домен.ру/
мой_домен.ру/index.php
Все эти три адреса разные с точки зрения поисковиков однако все они возвращают код 200 и абсолютно одинаковую страницу, что неправильно. Лучше код 200 возвращать только по этому адресу мой_домен.ру/ потому что он чаще всего именно так прописан на других сайтах, а по остальным адресам возвращать код 301

Разделы могут откликаться на такие адреса:
мой_домен.ру/номер_раздела
мой_домен.ру/частичный_URL
мой_домен.ру/номер_раздела/
мой_домен.ру/частичный_URL/
Получается целых 4 одинаковых варианта.

Варианты для тем:
мой_домен.ру/частичный_URL/номер_темы
мой_домен.ру/частичный_URL/номер_темы/
мой_домен.ру/частичный_URL/номер_темы/0.htm - это справедливо когда в настройках заданно по умолчанию заходить на первую страницу
мой_домен.ру/частичный_URL/частиxный_URL
..........................................
Короче, все варианты даже трудно перечислить. И какому поисковику такое понравится?

То есть надо с помощью магического изменения .htaccess сделать так, чтобы всё форвардилось на мой_домен.ру/частичный_URL/частиxный_URL/, а по всем остальным вариантам возвращать код 301.

Кто подскажет, что нужно добавить в .htaccess?

---
Форум для родителей детей с ВПС: http://forum.dearheart.ru
Ilfa
Новичок


Всего сообщений: 21
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 янв. 2009
Я еще не включила опцию HURL на своем вебсайте, но собираюсь в ближайшее время, поэтому мне эта тема очень важна и интересна. Нашла в одном учебнике по SEO ("Professional Search Engine Optimization with PHP", Jaimie Sirovich, Cristian Darie, WROX Press) о URL canonicalization: /index.php versus / через .htaccess следующее:

RewriteCond % {THE_REQUEST} ^GET\ .*/index\.(php|html) \ HTTP
RewriteRule ^(.*)index\.(php|html)$ /$1 [R=301,L]

После этого попытка загрузить мой_домен.ру/index.php должна перенаправлять на мой_домен.ру по идее.

Дайте знать, если вам это пригодится, получится-не получится.

---
http://fotokulinar.ru
Dearheart
Почетный участник


Откуда: Нижний Новгород
Всего сообщений: 130
Рейтинг пользователя: 4


Ссылка


Дата регистрации на форуме:
27 дек. 2007
Попробовал - не получилось, возникла ошибка 500 internal server error

Возможно из-за того, что при включенных HURL всё многообразие человекочитаемых урлов переадресуется на страницу index.php которая уже определяет, что выводить. А мы по этому правилу сделали ещё одну переадресацию с index.php на корень сайта и получилась ерунда...

---
Форум для родителей детей с ВПС: http://forum.dearheart.ru
Ilfa
Новичок


Всего сообщений: 21
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 янв. 2009
Помимо .htaccess, можно попробовать осуществить то же самое через php. Предлагаемый вариант из того же источника:

if (preg_match('#(.*)index\.(html|php)$#', $_SERVER['REQUEST_URI'], $captures))
{
// perform a 301 redirect to the new URL
header('HTTP/1.1 301 Moved Permanently');
header('Location: ' . $captures[1]);
}

index.php в интеллектборде уже осуществляет принудительный редайрект, но там для переадрессации с нечеловекочитаемых URL.

---
http://fotokulinar.ru
Dearheart
Почетный участник


Откуда: Нижний Новгород
Всего сообщений: 130
Рейтинг пользователя: 4


Ссылка


Дата регистрации на форуме:
27 дек. 2007
Тут надо учитывать то, что переадресация должна быть только с адресов вида index.php а более длинные адреса вида index.php?а=... должны остаться без изменений так как эти страницы не дублируются.

---
Форум для родителей детей с ВПС: http://forum.dearheart.ru
Ilfa
Новичок


Всего сообщений: 21
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 янв. 2009
это да, но ведь можно добавить соответствующую логику, я думаю, я просто привела самый простой сегмент. Мне самой предстоит этим же заняться на своем сайте в ближайшем будущем, но пока я делаю для этого необходимые апдейты (как ключевые слова в некоторых URL и т.д.) и изучаю теоритическую основу. Если вы найдете решение, раньше чем я перейду на HURL, дайте знать, пожалуйста. Ну, если у меня получится раньше с URL canonicalization - то я поделюсь.

---
http://fotokulinar.ru
Ilfa
Новичок


Всего сообщений: 21
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 янв. 2009
Вставила такой код в .htaccess:

RewriteCond %{THE_REQUEST} ^GET\ .*/index\.(php|html)\ HTTP
RewriteRule ^(.*)index\.(php|html)$ /$1 [R=301,L]

Вроде бы работает.

---
http://fotokulinar.ru
Ilfa
Новичок


Всего сообщений: 21
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 янв. 2009
Вставила такой код в .htaccess:

RewriteCond %{THE_REQUEST} ^GET\ .*/index\.(php|html)\ HTTP
RewriteRule ^(.*)index\.(php|html)$ /$1 [R=301,L]

Вроде бы работает.

---
http://fotokulinar.ru
<<Назад  Вперед>>Модераторы: aerograf, wsxПечать
Intellect Board — cистема управления сайтом »   Техническая поддержка версии 2.22 »   Проблема повторяющихся страниц
RSS

1 посетитель просмотрел эту тему за последние 10 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
Ограничение доступа
не отображаются разделы
Архив версий
Установка стиля на Intellect Board 2.22
Завершилась работа над новой версией 3.00

Самые активные 5 тем RSS


Время выполнения скрипта: 0.0456. Количество выполненных запросов: 17, время выполнения запросов 0.0000
Creative Commons License Rambler's Top100 Rambler's Top100 Рейтинг@Mail.ru Valid HTML 4.01 Transitional Valid CSS!