grudge3_3

Напишу всё-таки что-нибудь по сео-тематике. :) Сегодня хочу выложить свои, и не только свои наблюдения и выводы по говносайтам. Точнее, по причинам их вылета из индекса ПС.

Несмотря на то, что я не “промышленник” и ГС у меня не так уж и много, всё-таки какая-никакая закономерность обнаружилась.

Начиная примерно с сентября, почти все мои ГС потеряли все страницы, за исключением главной. Я всё думал, что Яндекс подглючивает, и скоро всё может вернуться. :) В этот четверг из индекса вылетели и главные страницы. Думаю, про возврат можно забыть.

Итак, что вылетело:

1. Автоматически наполняемые ГС, контент д ля которых тянулся из RSS и пропускался через синонимайзер, роль которого выполнял плагин unikalizator для вордпресс. Эти вылетели в первую очередь. Ссылки продавал по схеме 5-5-5, на некоторых 3-2-2.

2. ГС, контент которых – отсканированные книжки. На одном из них контент уникальный, на двух других – нет. Вылетели враз – уникальность не помогла. Ссылки 5-5-5.

Что не вылетело:

1. Мой самый первый сателлит на джумле. Контент – скан статей из журналов. Уникальных статей от силы 10% – я тогда не умел как следует искать дубликаты. :) Единственный из всех ГС имеет ПР2 и ТиЦ 10. Наполнялся контентом не сразу, а по желанию моей левой пятки. Наполнение шло вручную. Ссылки продаю по схеме 7-5-5.

2. Мой второй ГС. Уже на вордпрессе. Контент уникальный. Наполнялся вручную. Нулевик. Ссылки 7-5-5.

3. ГС о кино. Контент просто взят на loadmovie.ru. Не синонимизировался. Просто тупо копипастил описание фильма и картинки. Точно таких же дублей в Яндексе – просто дохрена. И все в индексе. Ссылки пока не продавал.

4. Ну, и блог, который вы сейчас читаете. :)

Подытожим, что же объединяет эти ГС.

На вылетевших:

1. использовалась синонимизация (плохая читабельность)

2. Контент забивался либо сразу весь (в случае с отсканированными книгами), либо большая его часть сразу, а последующие статьи добавлялись через одинаковые промежутки времени по крону (rss контент). Т.е. либо всё, либо по расписанию с одинаковым интервалом. Не есть гуд.

3. Шаблоны для ВП не модифицировались вообще никак.

4. Ссылки практически не модерировались. Отбрасывал только адалт (и то, когда находил), казино, дипломы и пр. сомнительные темы.

На не вылетевших:

1. никаких синонимайзеров и уникализаторов. Несмотря на дублированный контент. Как следствие – хорошая читабельность.

2. применение форматирования текста.

3. Посты забивались по времени неравномерно. Вручную.

4. У всех этих ГС я немного изменял шаблон (либо шапку, либо структуру). Исключение – этот блог.

5. Ссылки либо не продаются, либо модерируются.

Пока  можно судить о том, что уникальность контента – не самый важный фактор.

Ещё одна интересная закономерность, скорее философская. Все оставшиеся в индексе сайты делались мной изначально не для продажи ссылок в сапе. :) Несмотря на то, что они всё равно не СДЛ.

Ещё интересно прочитать вот это (приведу цитату с армады 2007 года, писал товарищ  с ником Taburetkin):

Проверка на уникальность была изобретена еще в году этак 75, точно не знаю. Эту тему преподают в вузах давнын давно.
И Гугл просчитывает все математически. Он смотрит на слова как на символы используя формулы. Я не буду вдаваться подробно в сложные формулы проверки на уникальность. Но самый простой пример:

Синие тапки, как вы хороши – летом. Зачем мне валенки?

То есть очень грубо говоря:

a, b – c. d e?

Если применить синонимы:
Красные сапоги, уж вы прекрасны – зимой. Отчего мне туфли?

формула останется таже:
a, b – c. d e?


Ещё очень советую тем, кто не читал, прочитать все статьи СЕО Механика – там на эту тему сказано достаточно много интересных вещей. Особенно про уникализацию и закон Ципфа.

Но! Есть одно очень большое но. Прочитав вот эту тему и другие, ей подобные, начинаешь понимать, что ГС не такое уж гиблое дело. Надо только уметь их готовить.

На этом откланиваюсь. Бездельник.