Опубликован: 04.08.2008 | Уровень: для всех | Доступ: платный
Лекция 8:

Поиск в Интернете. Плагиат

< Лекция 7 || Лекция 8: 123456 || Лекция 9 >

SEO-оптимизация и увеличение энтропии

Десять лет назад поиск информации в Интернете напоминал детективное расследование. Тогда были разумеется, поисковые системы. Для поиска термина также нужно было набрать его в адресной строке. В куче появившихся ссылок приходилось выбирать жемчужины - сайты с нужным содержимым. Откуда же тогда брались все остальные страницы?

Представим себе, например, сайт туристической фирмы "Лето-отдых". Очень простой сайт, состоящий из нескольких страниц. На одной из них приводится описание тура в Сочи. Цены, условия, контакты - словом, все то, что нужно. Представим также себе, что таких сайтов несколько. Несколько реальных различных фирм, соответственно несколько представительств в Интернете. Реальный бизнес и его отражение в сети.

Теперь представим себе веб-мастера, который не владеет туристической фирмой, не предлагает поездки в Сочи, но умеет делать веб-страницы. Он делает одну страницу, на которую выводит кучу ссылок на сайты туристических фирм. "Отдых летом в Сочи", "Лето-отдых в Сочи", "Отдых в Сочи", "Поездки на море", "Дешевые туры в Сочи", "Условия проживания в гостиницах в Сочи" - вся страница испещрена подобными ссылками. Естественно, такая страница будет содержать как бы больше информации о поездке в Сочи, чем аскетичная страница настоящей турфирмы, предлагающей настоящие туры. Следовательно, в поисковых системах по запросу "Отдых в Сочи" она будет появляться на более ранних позициях, чем страница туристической фирмы. На "сайт" веб-мастера будут заходить много посетителей, поэтому ему остается лишь разместить там рекламу и получать за нее деньги.

Другой веб-мастер, увидев легкий доход первого веб-мастера, решил сделать свою страницу. Он изменил ее оформление, повесил еще больше рекламы, добавил те же самые ссылки - словом, сделал свой супер-каталог.

После того, как 1253 веб-мастера разместили свои каталоги, умный веб-мастер создал свой каталог. На котором стояли ссылки уже не на исходные сайты туристических фирм, а на каталоги обычных веб-мастеров. И конечно, он также разместил кучу рекламы с целью получать за нее кучу денег.

Пример умного веб-мастера оказался заразительным. Другие умные веб-мастера принялись мастерить свои каталоги каталогов, словом, процесс рос лавинообразным образом. Энтропия (хаос) увеличивается, полезной информации не прибавляется.

Что теперь ждет обычного пользователя, который набирает в поисковике "Отдых в Сочи"?. Он попадает на супер-каталог. Подождав, пока загрузится вся реклама, он ее посмотрел, затем все-таки перешел по ссылке каталога "Туры в Сочи - предложения". И снова попал в другой каталог. Перешел с другого каталога - и снова попал в каталог. Потеряв терпение и закрыв, наконец, каталоги каталогов, пользователь возвращается в окно поисковика и методично просматривая результаты, наконец, на 1000-ссылке попадает на сайт фирмы "Лето-отдых".

Понятно, что не для всех запросов был смысл создавать каталоги и каталоги каталогов. Например, нет смысла собирать ссылки на сайты синхрофазотронов и общей теории относительности. Потому что большинство пользователей не каждый день набирают такие запросы. Так (или почти так) обстояло с поиском в Интернет лет десять назад. Все были довольны, кроме самих пользователей, которые, найдя жемчужину настоящего сайта, были вынуждены записывать его, добавлять в Избранное, обмениваться ссылками - словом, тщательно беречь найденные результаты.

Понятно, что долго так продолжаться не могло. Появилась релевантность, которую придумали в компании Google и которая почти одновременно была реализована в компании Яндекс.

Релевантность (от англ. relevant) - это степень соответствия запроса и найденного результата, то есть его уместность. Полный механизм релевантности представляет собой ноу-хау поисковых компаний, которые, разумеется, раскрывать его не собираются. Но этот механизм позволяет получать конечному пользователю именно то, что он ищет. Для того, чтобы понять, как примерно работает идея релевантности, рассмотрим следующий пример.

Сайт туристической фирмы "Лето-отдых" стал очень большим. На нем публикуются мнения и отзывы туристов, предложения отелей, расписание авиарейсов в Сочи. Тысячи посетителей заходят на него каждый день, с удовольствием читают новые мнения, отзывы, разглядывают фотографии. В своих сайтах они ставят ссылки на замечательный сайт фирмы. Да, и каталоги тоже ставят множество ссылок на этот сайт. Есть еще конкурент туристической фирмы, который называется "Зима-отдых". Их сайт достаточно неплохой, но его аудитория поменьше. Поэтому и в каталогах появляется он реже.

Поисковые системы внимательно подсчитали количество ссылок на сайт фирмы "Лето-отдых", учли количество посетителей, и вывели его на первое место в результате. На второе поставили сайт "Зима-отдых". Сайты остальных фирм - в таком же порядке. Ну а каталоги, супер-каталоги и прочие каталоги-каталогов разместились на заслуженном 1000 месте, которое теперь никто и не смотрит.

В этом заключается идея расчета авторитетности страницы, которая называется (PageRank). Конечно, современная индексация страниц включает в себя множество параметров, но идея их сводится к предоставлению пользователям именно того, что они ищут.

Теперь нет смысла создавать раздражающие каталоги с рекламой и множеством ссылок. По ним все равно никто не будет ходить, потому что в поисковых системах они будут занимать крайне низкие позиции.

Для завершения картины, представим себе еще одну задачу. Владельцы сайта "Зима-отдых" захотели, чтобы в поисковых системах они были на первом месте, оттеснив сайт "Лето-отдых". Для этого они обратились к SEO (от англ. search engine optimization, SEO, поисковая оптимизация)-мастерам, которые обычно предлагают следующие подходы:

  • Белая оптимизация. Это законная, честная работа над повышением ресурса в позиции. Сюда входит написание уникальных, интересных материалов, которые будут привлекать посетителей. Например, в рассматриваемом случае, опубликовать интересные статьи, советы, которые будут привлекать посетителей. SEO-оптимизаторы также исправляют содержимое страниц, добавляя необходимое количество ключевых слов, а также размещают информацию о ресурсе в каталогах самих поисковых систем.
  • Серая оптимизация. Это не вполне честная работа над популяризацией ресурса. Например, если просто взять и скопировать тексты с сайта "Лето-отдых". Или договориться с другими популярными сайтами, чтобы они поставили ссылки на данный сайт.
  • Черная оптимизация. Она работает, но если ее обнаруживают в поисковых системах, то раскручиваемый ресурс вообще банится или понижается в рейтинге. К методам черной оптимизации относится спам, размещение ссылки ресурса на форумах, досках объявлений, блогах, и т.д.

В целом, SEO-оптимизация конечно нужна (особенно только что созданным сайтам, аналоги которых уже есть) но и без нее работает правило - если ресурс предлагает уникальную информацию, если он новаторский и интересный, то без всяких методов раскрутки он займет свое заслуженное первое место.

Прочитать то, что думает, например, команда Яндекса об оптимизации сайтов, можно в разделе Яндекс.Вебмастер (http://help.yandex.ru/webmaster/). Также Яндекс предоставляет инструменты http://webmaster.yandex.ru/, позволяющие оценить свой сайт с точки зрения поисковых запросов.

Какая поисковая система лучше?

Холивар (от англ. holy war - священная война) - это обмен сообщениями на форумах и блогах, когда участники пытаются убедить друг друга в преимуществе некоторых неочевидных альтернатив. Что лучше - Windows или Linux? Какой браузер лучше - Opera или Mozilla Firefox? Какая поисковая система ищет лучше? И хотя все эти вопросы зачастую лишены смысла, а проведение исследований чаще всего невозможно, поскольку трудно подобрать объективные критерии, все же нельзя сказать, что это задаваемые вопросы - риторические.

Что касается поисковых систем, то их можно оценить по количеству обработанных запросов. Согласно исследованиям аналитической компании comScore (http://www.comscore.com/press/release.asp?press=2018) за декабрь 2007 года, рейтинг мировых поисковых систем выглядит так:

  1. Google Sites: 41 млрд 345 млн; доля рынка 62,4%.
  2. Yahoo! Sites: 8 млрд 505 млн; 12,8%.
  3. Baidu.com: 3 млрд 428 млн; 5,2%.
  4. Microsoft: 1 млрд 940 млн; 2,9%.
  5. NHN Corporation: 1 млрд 572 млн; 2,4%.
  6. eBay: 1 млрд 428 млн; 2,2%.
  7. Time Warner Network: 1 млрд 062 млн; 1,6%.
  8. Ask Network: 728 млн; 1,1%.
  9. Yandex: 566 млн; 0,9%.
  10. Alibaba.com: 531 млн; 0,8%.

Яндекс занимает девятое место. Много это или мало? Учитывая то, что количество англоязычных пользователей значительно превосходит число русскоязычных, это отличный результат. Третье место компании Baidu.com объясняется тем, что это китайская поисковая система, обслуживающая запросы страны с населением более миллиарда человек. Понятно, что Яндексу удалось обойти другие русскоязычные поисковые системы и это объективный показатель.

Вместе с тем, представленные цифры все же не отвечают на вопрос, какая из поисковых систем ищет лучше? Ищет лучше в Рунете? Именно здесь и начинается холивар.

Все же можно дать несколько замечаний, позволяющих оценить работу системы в целом. Спустя какое время после размещения уникального материала, например, в блоге, он становится доступным в результатах поиска? Это легко проверить на собственном блоге. Какая система дает больше результатов при поиске редких, уникальных или специализированных запросов? Какова релевантность выдаваемых при этом результатов? Насколько выдаваемые результаты поиска являются актуальными?

Можно предложить множество подобных вопросов, которые каждый пользователь решает для себя сам.

< Лекция 7 || Лекция 8: 123456 || Лекция 9 >
Владислав Шутеев
Владислав Шутеев
Евгения Гетова
Евгения Гетова
Александр Запевалов
Александр Запевалов
Ольга Виноградова
Ольга Виноградова
Россия, Северодвинск, СФ ПГУ им. М.В, Ломоносова, 2008