Нужен уникальный контент?.. Часть вторая
Продолжим наш ликбез о рецепте "загона" в индекс Яндекса сателлитов. :)
Мои последние наблюдения заставили прийти к выводу, что перед тем, как включать автонаполнение сайта статьями (RSS граббером, портатором) или тупой копипаст контента для увеличения общего количество страниц (чем больше страниц добавлено в сапу – тем больше денег заработаем) нужно дождаться пока сайт попадет в индекс Яши. Тогда бот будет охотнее кушать все добавляемые страницы. А чтобы сайт попал в индекс, нужно хотя бы десятку-двадцатку страниц уникального контента для начала, чтобы произвести на Яндекс впечатление беленького ресурса. Это уже доказано :).
Для начала хотелось бы урегулировать вопрос уникальности контента, точнее что я под этим понимаю (у каждого может быть свое мнение :)).
Уникальный контент – это текстовые материалы, полных копий которых нет в индексе поисковой системы.
Недавно, уже не помню точно где, я наткнулся на забавную статью, в которой доказывалось, что уникального контента в природе не существует :). Автор полностью рерайтил статьи и загонял их в copyscape.com для проверки на плагиат. И каждый раз сервис находил кучу похожих статей, пусть и не на 100% похожих, даже в тех случаях, когда рерайт был ну очень жесткий.
Любой новый текстовый материал, написанный с нуля, может быть определен как копия уже существующего (зависит от тематики) и находящегося в индексе ПС документа. Так что вопрос, что считать уникальным контентом, а что нет, в принципе очень запутан, если не знать алгоритмов поисковых систем. Я в этом дилетант, честно признаюсь :))
Так к чему я развел всю эту канитель? :)
А к тому, что уникальным контентом можно считать уже существующую в индексе статью, но…
В комментах к первой части было высказано несколько предположений, о чем будет идти речь сейчас. И лишь одно из них оказалось верным :). Товарищи предполагали, что решение проблемы – это скан книг (такой геморрой мне нафиг не нужен), перевод текста с инглиша (это еще геморнее), заказ текстов у копирайтеров (неоправданно большие расходы для сателлита, с которого мы будем лишь продавать ссылки и иметь в потенциале доход максимум 2 бакса в день). Все эти способы хороши, спору нет, но вот одни из них требуют много времени на добычу контента, а другие много денег. И то, и другое при создании сателлитов (еще раз повторюсь, ИМЕННО САТЕЛЛИТОВ!) лишнее.
…непохожую саму на себя :))
Цитирую комменты…
Так нужно слова менять на синонимы и все. Есть надежда, что Яндекс не на столько хитрый. А страницы с идентичным контентом будут сливаться, т.е. в выдаче останется только одна в идеале. А копипасты не попадут.
Заменяйте слова на их синонимы!
Этот блог читают продвинутые люди, которые мыслят также, как и я. Приятно :)
Два новых сателлита, которые я запустил всего три недели назад по новой схеме, уже находятся в индексе. В отличие от той несчастной тройки, которую придется, видимо, сносить :).
Я сделал так: сначала забил в каждый из сателлитов по 20 статей (по 5 в день), слова в которых были заменены синонимами. Через два апа сайты были в индексе (все страницы!). Я стал увеличивать количество страниц (опять же по 5 в день), причем в один сайт я стал загонять такой же "уникальный контент", в другой – тупой копипаст. В результате после последнего апа почти все добавленные страницы попали в индекс!
Неужели так важно произвести первое хорошее впечатление на Яндекс, заставить его начать хавать сателлит, после чего можно добавлять все, что угодно – и он будет кушать это с аппетитом? Так ведь, получается, товарищи? :)
А об инструментах синонимизации (так ведь правильно пишется?) я расскажу Вам в заключительной части статьи :). Продолжение все еще следует :))
При поддержке:
Автоматизируйте процесс добавления нужных ссылок в сервисы социальных закладок!
VIP аккаунты от Traffic Converter – сила!


>А чтобы сайт попал в индекс, нужно хотя бы десятку-двадцатку страниц уникального контента для начала, чтобы произвести на Яндекс впечатление беленького ресурса. Это уже доказано :).
А вот и нет:)
30.04.2008 в 18:16У меня сайт, с полностью награбленным контентом яша проиндексировал за один ап. Не все страницы правда, но большую половину.
Так что пинги wp рулят! ;)
По моему, поначалу Яндекс легко индексирует и копипаст (правда, тоже не всегда). Другое дело, сколько такой сайт продержится потом в индексе )) (обычно очень недолго)
30.04.2008 в 18:48Ребят, ну где Вы были, когда я публиковал первую часть
30.04.2008 в 19:09этой темы? :))) Там же ясно все расписано и дополнено в комментах, почему именно так, а не иначе дела обстоят СЕЙЧАС. Живой пример перед глазами, как три сайта с копипастным контентом, пингами и добавлением в RSS Яндекс.Блогов никак не могу закинуть хотя бы главную в индекс, хотя с них уже пора продавать ссылки.
а что же мне в моем случае делать? неужели сайт с 300 проиндексированными страницами и который обновляется по 50-80 страниц в день яша выкинет из индекса?
30.04.2008 в 20:38А вот если я буду разбавлять копипаст 10% уникального текста, смогу я этим удержать сайт в индексе, как вы думаете?
“А вот если я буду разбавлять копипаст 10% уникального текста, смогу я этим удержать сайт в индексе, как вы думаете?”
Вы знаете, мне тоже интересно %-е отношение копипаста к уникальному, а если награбить сразу несколько сот страниц, после этого заменить все на синонимы, например в текстовом редакторе (тоже инструмент синоминизации :) И после этого, более ничего не обновляя стразу загнать в Яшу. У меня таким образом все слопал за милую душу.
01.05.2008 в 10:24Ну я непомню где читал, что должно быть 80% уникального и 20% неуникального контента, тогда можно ничего не бояться:)
01.05.2008 в 11:03В моем случае мне придется сутками сидеть и заменять слова на синонимы :) А необновлятmся я немогу т.к. у меня тематика такая. А если нанимать человека, для этой работы, это очень накладно, себя я (пока) позволить этого не могу :D
А для тематики, где обновляться можно раз в месяц, я думаю ваш способ, Максим, вполне подойдет ;)
Вот я и пытаюсь узнать, может можно как-то с пропорциями поиграть…
кстати, типа с праздником :)
01.05.2008 в 11:04а я думаю надо просто грабберы писать такие, которые в награбленное вставляют ключевые слова, тогда и от ключей польза будет большая, и контент будет “уникальным” для робота…))
01.05.2008 в 20:21Мне кажется сейчас очень сложно найти хорошую и доступную базу для синонимайзера. ИМХО
01.05.2008 в 20:24Я предпочитаю скан книги, это не много времени занимет.
Ольга, такие очень сложно написать. У меня есть похожий граббер, но уж очень плохо он всё это делает. Надеюсь в будущем такой появится :-)
P.S. ЗЕНИТ – чемпион!!!
01.05.2008 в 20:27Презренный манимейкер, ты смотришь? :-)
Леонид, насколько я себе представляю, почти уникальный контент необходим разве что для робото сайтов. А какой смысл такой сайт обновлять каждый день? Раз в месяц, и то, думаю можно обойтить просто автоматическим вдоизмением страниц (например в каждом посту рандомный вывод ссылок на сопутствующие новости)
01.05.2008 в 21:23Очень понравилось, спасибо!
02.05.2008 в 16:25Один умный чел реализовал такую штуку, скрипт замены предлогов таких как: в, на, с, про и т.д. на картинки, которые не приметны читателю, что на самом деле это картинки. Механизм был реализовать на портаторе. Не знаю, на сколько уникальным текст выглядит, но эксперементы проводились. Давно читал, подробностей не помню, жалко. А сайт назывался типо “гоя” чтоле.
02.05.2008 в 18:18Например гугол не учитывает при происке часто употребляющие частицы.
02.05.2008 в 19:43Отлично Яшка хавает копипастные сайты! Не надо парится! Но разбавлять его уникальным конечноже стоит.. Самый идеальный и простой вариант – сайт на ру домене, 20% уникального, 80% копипаста, пополнять пятёрочкой статеек (1 из них уникальная) раз в месяц.. И всё будет!!! ))) Контент лучше брать конечно с книжек.. Самому рерайтить большой геморой.. А после синонимайзера текст ваще нечитабельный получается.. Мы стихи Пушкина через него пропускали)) Пипец поржали))
02.05.2008 в 22:10Да, присутствующие про шинглы – супершинглы слышали?
По идее синонимайзинг должен не спасать, только рерайт.. насколько я вник в текст садовского..
Может он по началу хавает, а потом выплевывает?
02.05.2008 в 23:37Хотя хз – я только начинающий сателлидовод, поделитесь опытом у кого есть – сколько живет в индексе синонимизированный на автомате контент.
Вот делаю новый сайт пока один копипаст …, но подходит время заполнения уникумом, лень ужасно но думаю, что буду писать сам. Пусть не очень много так как тема мне не очень близка, но нужно да и другого выхода я просто не вижу.
03.05.2008 в 19:59Вопрос уникальности контента и способ его получения я бы отнес, наверно, к одному из самых обсужждаемых в кулуарах Рунета. Могу добавить, что пользовался синонимайзером – результаты, самые негативный – в итоге бред и бан. Ввод новых алгоритмов – Магадан – делет выдачу качественней, но значительно ужесточает процес отбора сайтов в индекс.
04.05.2008 в 00:36>Автор полностью рерайтил статьи и загонял их в copyscape.com для проверки на плагиат. И каждый раз сервис находил кучу похожих статей, пусть и не на 100% похожих, даже в тех случаях, когда рерайт был ну очень жесткий.
извини, но тут полную ерунду написал..
04.05.2008 в 08:41у меня 3 сталлита по 15 страниц рерайченных.
только что специально проверил все через copyscape.
на все 3 он показал – 100% уникальность.
уж незнаю что такое тогда “очень жесткий” рерайт который выдает кучу похожих статей..))
а у меня просто рерайт ничего не выдает..)
Ого :). Понятное дело, что при таком соотношении все будет нормально :). Может быть все наоборот?
Есть программы и скрипты, которые все это делают при минимальном Вашем участии :)
А какие книги ты сканишь? Романы? :) Или специальную литературу какую?
Ну конечно :). Я в экстазе :)). Сейчас качаю 3 Гб запись из Интернета – запишу на болванку и положу в коллекцию, в которой уже есть один экземпляр – матч Россия-Англия.
Для сателлитов самое то :). Посетители неважны – важно попадание в индекс и хороший тиц-pr.
Читай внимательнее – эксперимент проводил не я :). Оснований не верить этому человеку у меня нет.
А бан то за что? :))
04.05.2008 в 16:00Слышать то слышали, только вот не вникали :). Надо почитать на досуге.
04.05.2008 в 17:46>А чтобы сайт попал в индекс, нужно хотя бы десятку-двадцатку страниц уникального контента для начала, чтобы произвести на Яндекс впечатление беленького ресурса. Это уже доказано :)
У меня сателлит за первый же день создания каким-то чудесным образом Яшей проиндексировался. На тот момент он насчитал около 30 страниц с уникальным контентом не считая главную.
05.05.2008 в 16:02У меня десять сателлитов с полностью копипастным контентом проиндексировались за 1-2 апа.. может не в этом у вас была причина?
07.05.2008 в 07:52Раз на раз не приходится. Я ведь и говорю о том, что происходит с моими сателлитами, по которым я сужу, что происходит.
08.05.2008 в 15:34Уникальный контент для старта лучше всего брать из печатных изданий – выпуска от 80 года и ниже. Можно найти экземпляры на любую тематику и с уникальным тематическим текстом. Хотя, все одно нужно сразу пробивать на наличие дубликатов. Еще один плюс – материал разбит по тематическим разделам и подразделам
12.05.2008 в 07:16Яндекс действительно начинает хавать копипастный контент после того, как им индексируются страницы с уникальным контентом. Кроме того, мой копипастный контент с менее популярных сайтов схожей тематики он считает оригиналом, а их – копией, хотя их тексты были раньше проиндексированы.
02.06.2008 в 18:12Вот такая тупая арифметика
Да ни кто не может сказать точно , что же в конце концов уникальный контент
03.05.2010 в 17:29