Регистрация за 5 сек.
Здравствуй, друг!
Еще не зарегистрировался?

Войти за 5 сек. через :
Стоп-слова и особенности морфологии сео - текстов - Forum-Profit.RU

Стоп-слова и особенности морфологии сео - текстов

Гуру Форума
Сообщений: 1,795 Карма: 18.10
#1    18.01.2010, 17:46
Что такое стоп-слова?

Стоп-слова это распространенные слова, которые игнорируют поисковые машины во время поиска по ключевому слову. Поисковики не обращают на них внимания чтобы сэкономить место на своих серверах и ускорить процесс поиска.

Когда поисковая машина выполняет поиск, она исключает стоп-слова из поискового запроса и заменяет их маркером. Маркер это символ, который заменяет стоп-слова. Цель – сэкономить место на сервере. Таким образом, поисковые машины могут экономить место, сохранять на сервере большее количество веб-страниц и одновременно поддерживать релевантность поисковых запросов.

Пример: "работа в США" это поисковый запрос. В этом случае поисковые машины пометят стоп-слово "в" символом "*" и выполнят поиск "работа * США".

Давайте рассмотрим тот же поисковый запрос "работа в США". Некоторые поисковые машины сохранят все слова, но они исключат определенные употребительные слова из поискового запроса. Это делается для экономии времени. В противном случае им нужно сделать три разных раунда поиска. Один раунд для "работа", один для "в" и последний для "США". Но можно достичь релевантных результатов только по двум словам «работа» и «США», и, следовательно, сэкономить один раунд. Таким образом, чтобы сохранить время поисковики игнорируют некоторые слова.

Обычно стоп-список поисковых машин состоит из наречий, союзов, предлогов и т.д. Но, если употребительное слово существенно для запроса пользователя, можно заставить машину (например Google) включить стоп-слово в поисковый запрос используя знак "+".

Следует избегать употребления стоп-слов в мета-тэге <KEYWORDS>, поскольку они все равно будут проигнорированы.

Что такое морфология и почему следует анализировать текст страницы с учетом морфологии?

Морфология, за определением Википедии, это грамматическое учение о слове, включающее в себя учение о структуре слова, формах словоизменения, способах выражения грамматических значений, а также о частях речи и присущих им способах словообразования. Морфология вместе с синтаксисом составляют грамматику. Русский язык является флективным языком, что значит, что падежи имен существительных и прилагательных, например программа - программой, удобный - удобным, роды прилагательных, например новый - новая, временные формы глаголов работал - работаю, и другие словоформы формируются посредством изменения окончаний (иногда это также сопутствует изменением основы слова). Основа слова вместе с набором присущих ей окончаний называется леммой. Главная проблема при работе с морфологией - это определение леммы найденного на странице слова. Программа, используя встроенный словарь, содержащий около 150 тысяч лексем определяет лемму, или же основную форму найденного слова, и, при нахождении слов, принадлежащих к той же лемме "склеивает" их, и таким образом подсчитывает статистику различных словоформ как статистику одного слова. Впрочем, в отчете вы получаете статистику как по всей лемме (набору словоформ одной лексемы), так и по отдельным словам леммы. Подобным же образом работают поисковые машины, распознающие морфологию, например, Яндекс и Рамблер. Google, Yahoo, MSN и другие мировые поисковики морфологию не распознают, и при нахождении на одной странице слов "блог", "блоги", "блогов", посчитают их отдельно, в то время как Яндекс посчитает их различными формами одного слова. Для Яндекса, таким образом частота ключевого слова "блог " на странице будет выше, чем, например, для Google на той же странице.

Источник netpromoter.ru
Рекомендуем посмотреть
Похожие темы
Что выбрать : стоп/лосс или лок (замок)
Wise, так я не говорю о том чтобы вставать против шерсти по какой-то паре. Если ты внимательно читал моё сообщение я там писал про аналитику, про...
Особенности инвестирования в сайты.
В 21 веке Интернет стал очень быстро развиваться и, сейчас в России, наверное, уже не осталось людей, которые не пользуются интернетом. Многие также...
Тонкости оптимизации текстов под Яндекс
На прошлой неделе был проведен XIX вебинар, посвященный роли текстов в интернет-маркетинге. В ходе онлайн-семинара большое количество вопросов было...
Особенности Google Page Rank
Основой для расчёта релевантности сайта, и, в итоге, появление сайта в топе поисковой системы, является алгоритм Page Rank, который был изобретён...


Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)