Чесно кажучи, сідаючи за написання даного матеріалу, не мав конкретного плану щодо тексту.
Причин цьому кілька.

Мені досить набридли різноманітні seo напрямлені рухи, що відбуваються в інтернеті, за яким я спостерігаю і який я бачу перед своїми очима.
В світлі останніх рухів щодо клонування кількох сайтів із перекладами на іншу мову, є також певні думки, але мова не проте.
Найбільш цікавими моментами у всьому цьому є те, що пошукові системи, з певної точки зору, мають явну багу щодо індексування всіх сайтів без виключення. Трошки нижче спробую пояснити.
З іншого боку після вчорашнього викривання клону Блогорідера та Сайту Українських Друпалерів в мене був час поаналізувати ті клони та зробити певні висновки філософського характеру.
Про це ми трошки спробували поспілкуватись з Ярославом щодо цієї тематики, і він попросив написати мене статтю про методику виловлювання клонів, яку я досі не впевнений, чи є зміст писати.
Можна скільки завгодно пінитись щодо такого роду інтернет діяльності. Писати кляюзи всім і всюди, створювати цілі хрестові походи проти такого роду діяльності, намагатись відновити справедливість і тратити на це значну кількість свого часу і часу інших людей.
Але НМД - важливо спробувати зрозуміти, в чому ж тут суть.
Для чого створювати клон сайту?
Можна звичайно написати щось на зразок
- "Чуваки імпотенти, не вміють нічого робити, крім того, що брати чуже і переробляти, отримуючи з цього якусь користь."
- "Казли, я тут працював, створював цікаві статті, а якесь мудило все взяло і користується"
ну і тут вже можна багато різних думок описати, в кожного з "постраждалих" - своя, можете поділитись ними в коментарях - найбільш "солідні" і "гуманні" я додам в список.
Іншими більш цікавими моментами є те, що інтернет на сьогоднішній день ідеально пристосований для таких паразитуючих процесів. Але сумно мені стає, що даний процес часто вважається стихійним.
Переглядаючи ті мережі сателітів я побачив сторінки з PR3 від Гугля, багато PR2 та PR1. Чудова така технологія, правда? Я веду мову про технологію оцінки сторінок "чудовим" пошуковиком аля Гуугль.
Для порівняння, на цьому сайті після трьох років роботи є дві сторінки PR3 і всі інші сторінки PR0. В той час як банальні спам сайти через кілька тижнів місяців роботи отримують стартові показники вищі, чим сайти не спамерської напрямленості.
Та що тут казати, якщо в підказках для вебмайстрів від Гуугля чітко сказано процедуру піднімання рейтинга сайту. Тут дуууже важливо зрозуміти, що наголос в підказках зроблено не на якість матеріалів, чи на кількість користувачів, що переглядають матеріал, а лише на кількість зворотніх посилань.
Про блЯндекс розповідати багато не буду. За три роки - проіндексовано лише 9 сторінок і жодні листи не викидають сайт з бану. Мабуть таки заслужив це більше чим ті сателіти, які мають тІЦ 300-600 і індексуються 100 відсотково.
Але досить про це. Це особисто мої проблеми і можливо жодного відношення до теми статті немають.
Важливо сказати, що я також пробував робити сплог свого сайту. Так зване дзеркало в ЖЖ. І мене дуже серйозно після певного періоду почало турбувати те, що рейтинг сплогу став вищим за рейтинг головного сайту. При тому, що жодних рухів щодо розкрутки сплогу не було зроблено. Це мене зупинило і заставило задуматись, але якийсь логічний висновок до мене прийшов набагато пізніше.
Чому це так? Чому якийсь смітник отримує вищий рейтинг? І чи дійсно те, що я вважав рейтингом впливає якось на трафік від пошуковика?
Ймовірна відповідь цьому - ЖЖ оплачує пошуковим системам задля збільшення рейтингу свого домену. Плата не обов'язково грошова. Але вона є. Хоча може я і помиляюсь.
Що в першу чергу представляє собою аля ЖЖ? - Правильно! Це рекламна площадка для сотень тисяч людей. Відповідно вигідно отримувати прибуток з такої площадки.
А коли реклама буде окуповуватись? - Правильно! Коли вона буде діяти і відображатись в максимальної кількості користувачів.
А хто в силах принести велику кількість трафіка на рекламну площадку? - Правильно - пошукові системи!
Цей союз - він освячений і одобрений всевишнім. Тільки безгрішний маркетолог не скористається таким шансом. Про методику такого користання можна написати не одну статтю. Можливо і напишу, якщо буде інтерес.
Спробую вернутись до клонів.
Клони та їхні мережі, які я побачив нещодавно - навели мене на аналогічні роздуми.
Що в решті решт отримує той, хто тратить своє життя на такого роду клони?
Він отримує можливість частково керувати пошуковими системами. Не дає їм розслаблятись так би мовити.
Тобто, маючи в своїх руках мережу сателітів, можна займатись розкручуванням інших сайтів за гроші.
І це діє!.
Діє по тій причині, що пошукові системи на сьогоднішній день - дуже далеко від ідеалу. Але грішно думати, що вони нічого не роблять, щоб змінити такий стан речей. І більше того, можна легко придумати механізми, які ефективно будуть змінювати.
Одна з причин - маркетинговий бік пошуку.
Я допускаю, що в списку деяких пошукових систем першочерговим стоїть пункт - віддача по фінансам. А десь далі, на пятому-шостому місці - якість пошуку.
Що роблять сателіти? Вони руйнують і пролазять через дірки в пошукових алгоритмах, роблячи теперішній стан речей - неідеальним. Вони наносять пошуковикам найпотужніший удар - роблять видачу абсолютно некоректною, заставляючи твердолобих любителів грошей думати про той четвертий-п'ятий пункт, який зветься "якість видачі пошукових результатів".
І після таких роздумів я серйозно задумався, чи дійсно настільки погані мережі сателітів і клони сайтів?
Спробуйте відповісти на кілька простих запитань
- На який сайт перейде живий користувач-ссавець, якщо він побачить в видачі пошука поряд оригінал і його спам-клон?
- Чи складно відрізнити Вам в видачі гугля сайт-спам і живий сайт?
- На який домен швидше перейде користувач - на xxx.livejournal.com чи my.ukrweb.info?
Останнє запитання - щоб збити Вас з пантелику.
Інша сторона медалі.
Чи дійсно важливий синтетичний показник класу Google PageRank? Чи це всього навсього PR? Може це лише засіб впливу? Такий собі джойстик-маніпулятор...
Просто наведу приклад.
Приблизно 5 місяців тому my.ukrweb.info мав PageRank5. Видача від пошуку при цьому була втричі меншою, чим місяць тому, коли всі сторінки отримали PageRank0, а головна сторінка PageRank2. Зараз PageRank3 і мене не може не радувати 300-500 юніків щодня, де левову частку мають пошуковики.
А тепер пофантазую трошки.
Якщо б я був ВеликимПошуковиком і хотів би керувати цим світом, то я б створив кілька показників PageRank і один з них я б відкрив людям, щоб вони займались оптимізацією і зароблянням грошей на ньому.
Після певного періоду життя більшість псевдорозумних істот навчиться багатьом залежностям і правилам "оптимізації" та "розкрутки" під публічний PageRank , в результаті чого виникнуть організовані структури для маніпулювання даним показником. З'являться гуру, біржі, програми, how-to, faq і безліч різноманітної інформації, але жодних даних від власника даного інструменту.
А тепер повантазую, якби я був аналізатором пошукової системи і працював би в вищенаписаному фантастичному світі.
Результати видачі в пошуку почали погіршуватись. Як це визначити? По кількості сторінок, які переглядає один користувач можна судити про багато чого. Є залежність якості видачі від того, на якому місці знаходиться правильний результат і сторінка, після якої користувач припинить пошук. Це не єдиний фактор, побудований на банальній і непробивній логіці. Можна фантазувати багато і в багатьох випадках буде певна доля правди з імовірністю вище 50% в випадку, якщо припущення містить в собі здоровий глузд. Продовжуйте тему далі...
А тепер пофантазую, якщо б я працював в віртуальному відділенні зменшення кількості текстових бірж(Якщо це дійсно є необхідним і якось погіршує видачу пошукових систем).
Скажімо при наступному оновленні пошукових показників я візьму і додам цього незалежного показника половині сайтів, які підозрюються в накрутці, а іншій половині - заберу. А наступного разу - навпаки - першим - зменшу, другим - збільшу.
Як Ви думаєте себе поведе більшість "оптимізаторів" у випадку зниження?
А як Ви думаєте? Складно за цим принципом вишуковувати дійсно спам-сайти, які є "гуру" оптимізації і реагують на найдрібніше коливання показників пошукових систем?
Мало? Читайте про користь запитань.


Насправді, стаття мало що
Насправді, стаття мало що прояснила. Але давай я спершу відповім на запитання:
50 на 50... можливо, вплине фактор того, який з цих сайтів знаходиться вище.
Складно або навіть неможливо. За деякими винятками, які можна вважати статистично незначущими.
В моєму випадку - my.ukrweb.info. Але не факт, що так поступлять усі.
Насправді я згоден з тобою, що найкращим і найнадійнішим способом боротьби зі сплогами, сателітами, різними там клонами та іншим подібним брудом стала б абсолютна зміна алгоритмів пошуковиків. Коли перестануть враховуватися зовнішні лінки - то абсолютно очевидно, що люди перестануть використовувати їх для накрутки пошукових показників і будуть використовувати їх так, як використовували у старі добрі часи - щоб допомагати користувачу орієнтуватися у складній структурі інтернету. Але сумна правда полягає в тому, що схоже пошуковики більше переймаються тим, як наказати порушників і ще на якись час продовжити життя старим алгоритмам (ну точніше - уже новим, але які базуються на старій ідеї)...
Втім, вся ця сумна правда хоч і пояснює існування сплогів і сателітів - вона не може виправдати його. Тому поки пошуковики думають, як змінити алгоритми, щоб мінімізувати зовнішній вплив на результати пошуку (а я впевнений, що як Гугл так і Яндекс цим займаються, щоправда кожен - з перемінним успіхом) нам не залишається нічого, як відстоювати свої права самостійно. Знаєш, коли хтось скопіював мій сайт, мені байдуже, наскільки сильно це нашкодить Гуглові чи Яндексу і наскільки швидко останні поміняють свої алгоритми. Мене переймає, наскільки сильно це шкодить мені.
Власне, тому я й просив про статтю, в якій би давалися якісь нові методи визначення клонів. Адже у випадках з безкоштовними хостерами боротися з ними виявляється доволі нескладно. Найскладніше - знайти!
А всім українським блогерам радив би пошукати мережею. Існує чимала ймовірність, що вас також скопіювали.
P.S.: то що там означали ті питання?
PublicRelations vs PageRank
Саме до цього я і прагнув.
А більшість натисне на ЖЖ, бо хто такий той my.ukrweb.info? А про ЖЖ - знають всі... Це чистий маркетинг. Клікається на ім'я, яке є більш відомим у випадку, ящо немає особистого знання як твій приклад.
Але головну ідею ти не зрозумів... публічний PageRank НМД не впливає на видачу абсолютно. Інакше я б зараз був в глухому нулі по видачі пошуковиків з моїм PR0.
Існують певні внутрішні алгоритми, про які ми лише фантазуємо, а те, що пошуковики показують назовні - лише засоби впливу на оптимізаторів(один з прикладів пояснення).
Якщо поясниш мені, для чого це потрібно - напишу.
Погоджуюсь з podarok щодо ПР.
Погоджуюсь з podarok щодо ПР. Так, через продажу посилань на Сапі мій сайт з математики отримав ПР = 0 (з 3 на головній, та з непоганими піарами для решти сторінок) для всіх сторінок. Але відвідуваність (а також віддача від самого Гугл) майже не змінилась.Отже, мабуть, він веде "подвійну бухгалтерію" :) Тай видача в результатах пошуку теж ніби залишилась. Скажімо, до "покарання" з боку пошуковика (google.com.ua) за запитом "математика" я був на 1-3 місці, так і зараз це збереглося. Можливо ненадовго (тьху-тьху) та все ж.
>публічний PageRank НМД не
а хіба це не було очевидно і без статті?
Точніше - якийсь вплив він (PageRank) таки має. Але цей вплив достатньо мізерний, щоб можна було його ігнорувати. PR - це просто пузомірка. Але оскільки її можна легко порахувати - то ця пузомірка стає єдиним фактором, на який намагаються впливати вебмайстри. Тим більше, що алгоритми її виникнення більш-менш зрозумілі (я ж навіть статтю про це писав)...
Гугл навіть не приховує, що у нього є й інші (і набагато важливіші) критерії ранжування сайтів, які він не відкриває широкій спільноті. Наприклад TrustRank.
Якщо пояснення: щоб хоча б якось боротися з плагіаторами, поки пошуковики удосконалять свої алгоритми і плагіат стане невигідним - замало, тоді не пиши. І тим більше, якщо тобі це нецікаво, то не хочу нав"язувати свою тему. Кожен сам вибирає, про що писати :)
існує дійсно корисна методика
Пропоную тобі набагато кращий варіант...
Не вбивати плагіатора в корню, ще до того, як пошукові механізми почали їх відслідковувати...
Для того аналізатори пошукових систем просто повинні про це дізнатись...
Дай розвинутись тим мережам. Дай їм можливість конкретно засвітитись.
А після певної стабільності - багатосотенні кляузи в спам-шухер гугля, яху, яндекса, рамблера, мсн, copyscape тощо.
Крім того засвітити домени в всіляких антидоменних структурах та opendns клонах щодо тих безкоштовних хостерів розплідників.
В результаті твій домен, клон якого ти викриєш стане довіреним дефакто, о на нього гляне людина і прийме рішення щодо зняття з домену можливих банів, в той час як всі інші домени і мережі мереж сателітів можуть просто бути викинути охапкою в смітник.
Ось що я пропоную...
Зміна алгоритму пошуковиків.
А тепер подумай, що краще?
- вбивати клони в стадії, коли пошуковики про них ще нічого не знають і не знатимуть.
- повідомляти про клони пошуковим системам через їхні feedback форми.
> " ... А всім українським
> " ... А всім українським блогерам радив би пошукати мережею. Існує чимала ймовірність, що вас також скопіювали ..."
jarofed, з кожним днем все більше починаю сумніватись в тому, що існує ймовірність того, що статтю з блоґу (особливо цікаву та корисну) чи її частину хтось таки не скопіював без дотримання правил. В країні, де не діє захист інтелектуальної праці, це - норма.
Тепер давай(те) поміркуємо. Як бачимо українська блоґосфера потрохи зростає. Хоча україномовні блоґи в більшості й наділі "дулю з маком" приносять, але ж все таки зростання помітне. З нею росте й кількість якісного цікавого оригінального контенту. Ну, і питаннячко: кому насправді на сьогоднішній день вигідне це зростання. Блоґерам? Невже!!? Чи може є біля корита й інші "заробітчани"?
Без вирішення проблеми з захистом інтелектуальної власності, покаранням винного ми просто топтатимемося на місці. Бо немає сенсу писати 1000 постів (вклавши в них частинку своєї душі), прибуток від яких частково отримуватиме "чужий дядько" (імхо звичайно).
Оригінальний контент всім потрібний, а на решту - начхати! Там, де можна заробити копійчину на чужій праці, ЗАВЖДИ БУДУТЬ ДОБРОВОЛЬЦІ "копіювального" жанру і їм до "лампочки", чи це справедливо, чи чесно, адже це + декілька центів в їх гаманець.
imho: cитуація, скажімо, для більш-менш відвідуваного українського блоґу, що звучить українською мовою, була б ще загрозливішою, якби ту ж українську знало більше людей. Тоді copy-paste був би на кожному кроці. Та найгірше те, що "передерають" українській контент, як правило, українці в українців. Чи ви думаєте, що наш старший брат аж так цікавиться хвацькими укр. блоґами, чи може, що в них бракне оригінального контенту.
Тому маємо те, що маємо. (От, бачити "скопіпастив" чужий вислів. Сорі)
Погоджуюсь з podarok щодо ПР.
Погоджуюсь з podarok щодо ПР. Так, до прикладу, через продажу посилань на Сапі мій сайт з математики отримав ПР = 0 для всіх сторінок (з 3 на головній, та з непоганими піарами для решти сторінок). Але відвідуваність (а також віддача від самого Гугл) майже не змінилась. Отже, можливо, Гуглик веде "подвійну бухгалтерію" :) Тай видача в результатах пошуку теж ніби залишилась. Скажімо, до "покарання" з боку пошуковика (google.com.ua) за запитом "математика" я був на 1-3 місці, так і зараз це збереглося. Можливо ненадовго (тьху-тьху) та все ж - не ПР'ом єдиним.
Ура! Я знаю "найкращий спосіб
Ура! Я знаю "найкращий спосіб боротися з плагіаторами"! По секрету скажу, але обіцяйте нікому більше не казати. Ну, то як? обіцяєте?
Найкращий і єдиний 100%-во дієвий спосіб боротьби з плагіатом - це самому стати плагіатором і ніколи, повторюсь ніколи не писати самому матеріал.. Ну-у, навіщо це робити?! Навколо стільки ж сайтів.
P.S. Сподіваюсь, даний P.S. є зайвим. Але все ж уточню - се був сарказм.
можливо, пошуковикам треба
можливо, пошуковикам треба залучати громадськість ("соціалізувати" видачу) для ранжування видачі; із системами контролю та відслідковування відповідальності учасників.
Хех
Правду тобі скажу.
Якось шкода часу на те, щоб думати за технічну підтримку та напрямки майбутнього розвитку пошуковиків, не будучи у руля цих самих пошуковиків 8)))...
Соціальність видачі існує в яху, де кожен може свій сайт зарегати в консолі вебмайстра і вказувати на спам. Це відноситься виключно до власних вебсайтів.
Ну це і зрозуміло, бо в протилежному випадку будуть мінусувати чуже.
Загалом і в гугля є через ту саму консоль можливість повідомлень про спам у видачі. Інша справа, що це не дуже зручно... Але спірно.
Гарна стаття!
З того що ти нафантазував тут виходить, що у Гугля самий протирічливий, проте найдієвіший інструмент :)
Напвено, що такий стан справ буде доти, доки його не змінить черговий "революційний" метод ранжування для видачі у пошуковиках.
П.С. 'hyves' вже ніяк не відкликається, але про експеримент всерівно розкажеш, так?)
hyves
8)
Можна і розповісти...