Давно cобирался написать статью, посвященную одному из фундаментальных аспектов SEO – структуре доменных имен и урлам. Хочу заранее предупредить, что все написанное ниже является не правилом, требующем немедленного исполнения, а скорее рекомендацией. Этот список следует воспринимать так: «было бы хорошо, если бы вы могли», а не «если вы это не сделаете, Гугл не проиндексирует ваш сайт». Гугл и Бинг прошли долгий путь и вы их ничем не удивите, но будет лучше, если вы приложите немного усилий в плане SEO. Поисковые системы (и пользователи) несомненно это оценят.
1. Старайтесь использовать один домен и поддомен.Это пожелание не требует обязательного исполнения и если использование поддомена это единственный способ создать блог или разместить необходимый контент, то это меньшее из зол. Но ваш блог будет намного лучше ранжироваться если весь контент будет располагаться на одном саб и корневом домене.
2. Используйте ЧПУ урлы.Ужа давно не секрет, что чем легче пользователю прочитать название сайта, тем лучше для поисковых систем, а следовательно и для самого сайта. Этот фактор сейчас особенно силен, потому что поисковые системы научились распознавать поведенческие сигналы и могут точно определить уровень вовлеченности пользователя.
Надеюсь, следующие примеры все наглядно продемонстрируют.
Достоинства ЧПУ для посетителя очевидны:
подобные адреса очень легко запомнить;
можно продиктовать URL по телефону;
подобные URL, как правило, позволяют пользователю, даже не глядя на страницу, сразу понять, где он сейчас находится, и как следствие, помогают лучше разобраться в структуре сайта.
3. Кейвор в урле по прежнему работает.Размещение ключевого слова к урле полезно по нескольким причинам:
Во-первых, ключевые слова в урле помогают пользователям не заходя на сайт определить что они там увидят. На примере внизу, обратите внимание на стрелочку в нижнем левом углу)
Во-вторых, урлы часто копируют и вставляют и когда в ссылке отсутствует анкорный текст, урл сам выступает в качестве анкора. (что является важным фактором ранжирования).
В-третьих, ключевые слова в урле видны в результатах выдачи, а это повышает шансы, что пользователь выберет именно ваш сайт.
4. Несколько урлов для одного контента? Канонизировать их!Если у вас 2 урла ведут на один и тот же контент, то их следует канонизировать, используя либо 301 редирект (если нет никаких оснований для сохранения дубля) или rel=canonical (если вы хотите сохранить различные версии для некоторых посетителей, например, страница для печати).
Дублирование контента не является основанием для наложения санкций, но это может сказаться на позиции сайта в выдаче.
5. По возможности исключите динамические параметры.Такая ссылка выглядит очень уродливо:
Большинство современных CMS платформ дают возможность изменять параметры урлов. Используйте такие инструменты как
mod_rewrite и
ISAPI rewrite или MS
URL Rewrite Module (для IIS).
Некоторые динамические параметры используются для отслеживания кликов (например в популярных приложениях, таких как Buffer). В целом, это не вызывает особых проблем кроме длинных, странно выглядящих урлов.
Кроме того, исследования показывают, что люди гораздо охотнее делятся короткими урлами (не является фактором ранжирования, но оказывает опосредованное влияние на SEO).
6. Чем короче, тем лучше.Если вашего урла в пределах 50-60 знаков, то вам не о чем беспокоиться. Но если длина больше 100, то его лучше переписать. С Гуглом и Бингом как раз никаких проблем не будет. Они прекрасно обрабатывают длинные урлы. Проблема скорее касается юзабилити. Короткий урл легче скопировать и вставить, а так же поделиться в социальных сетях.
7. Делайте урлы похожими на тайтлы.Это не значит, что если ваша статья называется "My Favorite 7 Bottles of Islay Whisky (and how one of them cost me my entire Lego collection)", то урл должен ее полностью повторять. Скорее там должно быть что-то вроде:
randswhisky.com/my-favorite-7-islay-whiskies
или
randswhisky.com/blog/favorite-7-bottles-islay-whisky
Ориентируйтесь на ожидания пользователя, который по урлу делает предположение о том, какой контент он найдет на сайте.
Сравните:
В первом примере совершенно непонятно о чем идет речь. А вот та самая статья на которую ссылаются:
8. Исключите стоп-слова.Если ваш заголовок содержит стоп-слова (и, или, но, а...) нет никакой необходимости включать их в заголовок. С другой стороны это не критично. Если есть возможность сделать ваш урл короче, то почему бы ей не воспользоваться? Вы должны сами принять решение исходя из легкости восприятия/длины.
9. Удалите лишние знаки пунктуацииС момента его изобретения и по сей день стандарт урл обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов: латинские буквы, цифры и лишь некоторые знаки препинания. Если мы захотим использовать в URL специфические символы, то они должны быть перекодированы особым образом.
Вот
список доступных/недоступных знаков препинания.
10. Ограничьте число редиректов.Если пользователь или поисковый бот запрашивает урл A, который отправляет на урл В, то все прекрасно. Все хорошо даже если урл В потом отправляет на урл С (было бы идеально, если урл A напрямую ссылался на урл С, но это не критично). Но если редиректы продолжаются и дальше, что дело плохо.
Конечно поисковые системы смогут отследить любое количество редиректов, но в прошлом они уже выступали против подобной практики и могут хуже ранжировать страницы, которые на их взгляд не важны.
Гораздо большие затруднения редиректы вызывают у пользователей и браузеров (особенно мобильные браузеры, которые борются с редиректами). Сведите число редиректов к минимуму и вы избавите себя от многих проблем.
11. Чем меньше папок, тем лучше.Сравните следующие урлы:
randswhisky.com/scotch/lagavulin/15yr/distillers-edition/pedro-ximenez-cask/750ml
randswhisky.com/scotch/lagavulin-distillers-edition-750ml
Я не хочу сказать, что косые линии (папки) могут нанести вред, но они увеличат глубину сайта как для пользователей, так и для поисковых систем и сделают правку урла более сложной (по крайней мере в большинстве CMS).
12. Избегайте хэшей в урле, которые создают отдельный/уникальный контент.Хэш (идентификатор фрагмента урл) это специальный символ URL, который сообщает браузеру, что последующая часть адреса представляет собой ссылку на HTML элемент с таким id или именованый якорь (named anchor) текущей страницы. Например, с помощью хэша можно отослать пользователя к конкретному комментарию в блоге. Хэши так же могут быть использованы как как как параметры отслеживания (например, randswhisky.com/lagavulin#src=twitter).
Использование хэшей для других целей, например, для обозначения уникального контента — плохая идея.
В качестве исключения Гугл позволяет разработчикам использовать формат hashbang для динамических приложений AJAX, но даже они не столько user-friendly как статически, переписанные урл. Сайты вроде Amazon и Twitter значительно выиграли, когда упростили свои урлы и избавились от громоздких хэшей.
13. Будьте внимательны к регистру.Короче говоря, если вы используете серверы / IIS Microsoft, то все в шоколаде. Но если вы поклонник Linux/UNIX, то проблем не избежать, поскольку они по разному интерпретируют регистр и randswhisky.com/AbC будет совсем не тоже самое что randswhisky.com/aBc.
Идеальным решение будет если неверный регистр в урле будет автоматически редиректиться/канонизироваться на правильный урл. Есть специальный htaccess
протокол, который может помочь в этом.
14. Дефисы и подчеркивание наиболее предпочтительные разделители слов.Раньше я рекомендовал избегать подчеркивания в качестве разделителя слов в урле. Но за последние несколько лет поисковые машины успешно преодолели проблемы,связанные с распознаванием подчеркивания, и теперь воспринимают подчеркивание и дефис одинаково.
Пробелы тоже работают, но в урле они отображаются как %20, что затрудняет восприятие.
15. Избегайте переспама ключевых слов в урле.Посмотрите на пример, расположенный ниже, где вам несколько раз встретится "canoe puppies". Такое часто повторение ключевого слова не лучший вариант и может отпугнуть пользователей.
На ранжирование это тоже не оказывает никакого влияния, поскольку Гугл и Бинг уже давно не используют алгоритм, который учитывает ключевое слово, появляющееся несколько раз в урле.
Оригинал статьи на английском языке:
http://moz.com/blog/15-seo-best-practices-...tructuring-urls