Один мой знакомый решил провести эксперимент – залить на трастовый 12-летний домен со значением параметра ТИЦ >1000 кучу копипаста. На вопрос, что же являлось целью эксперимента, ответил, что хотел просто проверить, простит ли Яндекс ему эту наглость. Думал, что траст сайта выдержит такой наплыв копипаста. Выдержал или нет, как думаете? 🙂

Нет, не выдержал:

Короче говоря, сайт за пару апов залетает под АГС, при этом залито было тысяч 10 страниц копипаста (где-то по 1к в день), но Яндекс еще не успел все проиндексировать, хватило и пару тысяч, чтобы отправить сайт под фильтр.

Сайт новостной тематики, владелец просто взял тупо распарсил новостники и залил этот весь копипаст на свой трастовый старый домен, а теперь сидит и думает, как бы его вытащить из под АГС. 🙂

Стоит отметить, что первая проиндексированная тысяча страниц – восстановленный из вебархива контент неизвестно какого происхождения, но Яндекс решил что все же для него найдется место в выдаче, возможно, за счет трастовости домена и того, что этот контент был восстановлен с вебархива этого же домена. Когда же залилась пачка копипаста – выплюнул все из индекса.

Я как-то тоже экспериментировал с парсингом контента из вебархива, но после того как парочка молодых сайтов на этом контенте залетела под АГС, решил, что вебархив это тухлая тема. Если в выдаче Яндекса нет контента из вебархива – это не значит, что Яндекс про него не знает. Было бы глупо рассчитывать, что Яндекс такой тугой.

Еще я как-то писал что можно парсить контент из сайтов, которые попали под АГС. Вот тут показал как такие сайты просто и легко искать. Но этот способ тоже не стоит использовать даже если на сайте под АГС реально уникальный контент, опять же, Яндекс о нем наверняка знает и для него он НЕ уникальный. В качестве дешевого контента можно использовать сканы.

На данный момент наш горе-экспериментатор удалил весь копипаст, видимо контент из вебархива тоже удалит, а сам сайт ежедневно наполняется пятью новостями (рерайт). Будет очень прикольно, если в ближайшие апы сайт самостоятельно вернется в индекс. Будем наблюдать, возможно, в процессе нарисуется очередной кейс по выводу сайта из АГС.

Не забываем подписываться, лайкать, ретвитить, плюсадинить. 🙂

Dorian.by

Чтобы мозги немного отдохнули, можно послушать вот этот тупизм: 🙂