форум общения русскоязычных пользователей CMS Текстпаттерн
Вы не зашли.
подходит ли Textpattern для продвижения в поисковиках
Неактивен
подходит
Неактивен
Подходит - у вас в руках средство, по полному контролю за хтмл кодом.
Неактивен
Как я понимаю, продвижению сайта в поисковиках могут весьма мешать проблемы с индексацией страниц сайта в поисковиках. Проблемы при индексации есть, и главная в том, что TxP генерирует много двойных или пустых страниц под запросы, т.е. при обращении к ним. Ошибка 404 редко появляется в таких случаях, несмотря на то, что таких страниц на сайте фактически нет. Особо проблемные страницы Sticky, страницы /? и страницы выдаваемые в RSS.
Если в URL есть ?c= то одна и та же страница выдается по адресам /sitename/section/?c=categoryname и /sitename/section?c=categoryname. Например Яндекс проиндексировал обе такие страницы, да еще есть и третий и четвертый вариант в индексе - без нескольких букв в названии категории или только до черточки в названии категории. На два последних адреса TxP выдает страницы с шапкой сайта и sidebar, но без текста файла, т.е. с пустым белым полем.
Страницы с номером тоже проблема. Например, страница sitename/section/?pg=4&c=name - последняя, пятой страницы пока нет. Но если вызвать /?pg=5&c=name, /?pg=6&c=name, /?pg=7&c=name и т.д., TxP выдаст их все, опять же с пустым белым полем под шапкой сайта.
Есть также лишние URL, появляющиеся в RSS, например, есть /rss/ - основной, на который на сайте есть ссылка, но если запросить другие варианты, то можно увидеть /rss/?section=name , /rss/?category=name , /rss/?section&category=name и др. в различных вариантах и с разным набором URL, в том числе двойных. Я об этих проиндексированных вариантах узнала только тогда, когда посмотрела на сайт в Yahoo Site Explorer. Сразу же 60 или 70 несуществующих URL удалила, и все равно периодически приходится удалять по 2-3, которые TxP зачем-то генерирует, а поисковики индексируют. Частично этот вопрос удалось решить запретом отдавать в RSS некоторые секции, что тоже не очень хорошо.
Слеш на конце тоже проблема. Например, есть секция /sitename/sitemap/ для посетителей, в ней перечень всех разделов и файлов сайта. TxP выдает ту же самую страницу и по адресу /sitename/sitemap, а поисковики индексируют обе. Так же и с другими секциями.
Конечно, можно частично объяснить такие проблемы строением сайта, но не думаю, что все, или что это только на моем сайте. Может кто знающий и умеет справляться с такими проблемами, но нигде это не описано. Мне например не очень удается удержать нужное количество URL сайта в индексе (т.е. не допускать в индекс пустые и двойные). Несколько помогает подача карты сайта основным поисковикам. Да и то с переменным успехом, т.к. поисковики периодически игнорируют карту сайта.
Неактивен
На ум приходит rel="canonical" но его пока только гугл знает. Плюс еще можно в .htaccess прописать редиректы или выбрасывать 404 ошибку в "плохих" урлах. И, по-моему, если хорошо пролинковывать внутряк, включая страница категорий и секций, то проблема дублей должна решиться со временем.
Неактивен
-- Например, страница sitename/section/?pg=4&c=name - последняя, пятой страницы пока нет. Но если вызвать /?pg=5&c=nam
-- если запросить другие варианты, то можно увидеть
Ну так поисковики наугад УРЛы не перебирают вроде. Гугл так точно. Нечего и париться. И поставьте человекопонятные УРЛ.
-- Особо проблемные страницы Sticky
Нет сылок на них, вами сделанных - нет проблем.
-- Слеш на конце тоже проблема.
Cлеш на конце - стандартное поведение любого сервера с любым движком. Лечится htaccess'oм.
Неактивен
glebotr написал:
-- Слеш на конце тоже проблема.
Cлеш на конце - стандартное поведение любого сервера с любым движком. Лечится htaccess'oм.
Да лечится, согласен, но это небольшая, но все таки нагрузка, и кажется плюс один редирект. Но такое поведение не только в Textpattern. Скажу сразу я не замерял(пока не было нужды), но есть мнение что apache отдает страницу быстрее если на конце есть слеш. И я зарание пытаюсь везде куда дотянуться руки поставить слеш в конце, если конечно время позволяет.
Отредактированно Redduck (04-08-2011 12:36:40)
Неактивен