спонсори:

Google related: - Аналіз механізму для Українського сегменту Інтернету


Хочу привітати всі вебсайти, що звуть себе Українськими.

Ми разом мабуть перейшли якусь критичну точку, щоб розпочалась робота механізму Google related: Search.
Відбулась дана зміна сьогодні або вчора, бо два дні тому такої інформації пошуковик не надавав.

Related Flowers

Раніше я намагався зробити деякий аналіз цього механізму, але жоден з моїх власних проектів, чи проектів знайомих не проходив по цьому показнику. Тому, як кажуть - не було кроликів. Було кілька Українських сайтів, які мали значний трафік і для них гугль відображав таку інформацію, але вона була не показовою.

Тепер - є. І новина ця не може не радувати, бо це значить ли ше одне - наші "сумнівні" проекти набули якогось нового статусу і почали між собою в'язатись новою, більш хитромудрою логікою.

Якщо поглянути на документацію самої пошукової системи - то все, що вона пише про даний механізм

related: Pages that are similar to your site

Як не дивно - це все. Тому і приходиться займатись reverse engineering.

Але даний механізм, з огляду на мій власний досвід працював раніше лише на дуже великих і активних вебсайтах, що дає певні думки для аналізу.
Це не означає, що ми всі разом якось виросли, це лише значить, що увага до нас - трошки покращилась. І сам механізм структурування пошуку - ускладнився в бік більшої кількості факторів.

Спробую проаналізувати кілька вебсайтів, які раніше не відображались за даними запитами взагалі.
Чому саме вебсайтів, а не окремих сторінок - бо механізм related: відображає саме список схожих вебсайтів, якщо на сторінку з даного вебсайту немає схожих сторінок. Я спробував пошаритись по списку власних статтей і побачив, що більшість сторінок немають схожих і відображається список схожих вебсайтів(сторінок, схожих на головну)

Ну звичайно, що першим буде саме

  1. http://my.ukrweb.info
    Розбивка по мовності сторінок
    • 9 англомовних
    • 13 російськомовних
    • 0 україномовних, хоча візуально - 7 сторінок там - українського походження

      Головні ознаки, які я можу побачити із списка і які можуть мати відношення щодо впливу на такого роду індексацію

    • Назва Сайту - ~12 з 22 мають даний показник
    • Розміщення зворотнього посилання на всіх без виключення сторінках іншого сайту - зроблено це на одному сайті із списка, що дає гугль, але в результаті сам сайт з беклінками і ще 7 сайтів, що є схожими до вже сайту з беклінками приписуються якогось фіга схожими і до сайту, на який вказують беклінки.
    • Лише один сайт із списка має back-related зв'язок із my.ukrweb.info - всі інші при пошуку подібних сайтів до них не відображають, що my.ukrweb.info - є подібним. Я вже другий день мучу гугль і все, що побачив, так це в третьому-четвертому за глибиною переході по related посиланням наявність якогось більш-менш логічного зв'язку, що навело мене на суб'єктивну думку про те, що крім головного фактору щодо назви сайту десь якимось фактором є зв'язок по перелінковці між сайтами.
  2. blogosphere.com.ua - наступний кролик. 28 схожих сайтів.
    • 2 англомовних
    • 18 україномовних
    • 8 російськомовних

      Ознаки, які візуально можна витягти із списка

    • Назва сайту - це безумовний лідер фактору
    • Прізвище автора як не дивно вплинуло на схожість із кількома іншими сайтами
    • Досить цікавим фактором є те, що схожі сторінки видаються також з цього самого сайту.
      Враховуючи партнерські стосунки між Блогорідером та Блогосферою і самою розкрученістю тематики, яку обрали даних два проекти - схожість матеріалів на досить високому логічному рівні. Можна сказати, що спаму в видачі гугля по цим проектам практично немає.

  3. blogoreader.org.ua - ще один претендент. 29 сторінок related:
    • 2 російськомовних
    • 27 україномовних
    • 0 англомовних

      Фактори схожості

    • Назва сайту
    • Перелінковка - явно прослідковується вплив взаємних посилань як з блогорідера на сайти, про які він розповідає, так і з сайтів, що посиланються на блогорідер.
    • Найгірше те, що я не бачу зв'язку по контенту. Гуглю явно потрібно ще працювати над алгоритмом, бо для старту даний вигляд мені не зовсім подобається.

Думав написати про ще додатково 20 інших сайтів, спробував серед них відшукати додаткові фактори, але Ви самі побачите, що інших факторів там важко знайти.
Насправді.

Головні показники, які замічені за більшістю сайтів, що почали індексуватись за даним методом.

  1. Кількість схожих сторінок коливається в межах 5-30. Даний показник є максимальним для всіх сайтів в інтернеті.
  2. Мова сайтів - не впливає на схожість, були замічені як англійські, так і російські сайти
  3. Наявність зворотніх посилань - необов'язкова, але в більшості своїй - присутня
  4. і є фактором впливу на список в видачі навіть більше чим контент.

  5. Схожість в стилі та контексті посилань - спостерігається. Тобто, якщо у Вас сайт має корінь якогось слова в своїй назві - гугль може видати інший сайт схожим до нього, хоча контент може і не співпадати
  6. Зв'язку з наявністю вебсайтів в dmoz.org - немає!

Я не зовсім розумію, чому, маючи такий серйозний алгоритм як той, що використовується в Google Adsense і видавати такі позорні результати - це несолідно.

З іншого боку - є важелі, якими можна спробувати вплинути. В консолях адміністратора пошукових систем є можливість вказати на спам в видачі, показавши URL і видавши список сайтів, які на Вашу особисту думку не відповідають за змістом в видачі.

Більше того, якщо таку практику зробить більшість сайтів - людям в гуглі потрібно буде щось зробити з тим навалом фідбеків і тоді функція "Схожі матеріали" хоч трошки буде відповідати і наближатись до видачі, яку можна спостерігати на сайтах англомовного сегменту.

Успіху Вам.

Trackback URL для цього допису

http://itua.name/uk/trackback/459
Share this

Об'єднати вміст Об'єднати вміст

Propeople Expert

Партнери

експерименти

Rambler's Top100