Вітаю братів по нещастю.
Чому саме так? Причина проста, тобто їх дві - ми мало що робимо + для нас нічого не роблять...
Я про зручність та коректність використання Української мови в Інтернеті.
Читаючи W3C.org, - не знайшов жодних проблем створення сторінок українською. Все дуже зрозуміло та розвинуто описано. Присутні великі можливості по багатомовності веб сторінок та використанню кількох мов навіть в одному документі - все це дозволено і для цього створені вси можливості.
Але, аналізуючи українські вебсайти, знайшов достатньо велику кількість проблем реалізації. І вже в голові крутиться кілька причин цьому. Спробую їх перерахувати з невеликими поясненнями.
План
Вітаю братів по нещастю.
Чому саме так? Причина проста, тобто їх дві - ми мало що робимо + для нас нічого не роблять...
Я про зручність та коректність використання Української мови в Інтернеті.
Читаючи W3C.org, - не знайшов жодних проблем створення сторінок українською. Все дуже зрозуміло та розвинуто описано. Присутні великі можливості по багатомовності веб сторінок та використанню кількох мов навіть в одному документі - все це дозволено і для цього створені вси можливості.
Але, аналізуючи українські вебсайти, знайшов достатньо велику кількість проблем реалізації. І вже в голові крутиться кілька причин цьому. Спробую їх перерахувати з невеликими поясненнями.
- Великі і ключові фігури українського інтернету не піклуються про коректність коду, який насправді використовують на своїх вебсайтах. Приклади(Випадкові! Жодної ієрархії та рейтинговості):
- i.ua - версія Українською мовою має теги <html xmlns="http://www.w3.org/1999/xhtml" lang="ru"> Супер просто! Не буду коментувати...
- meta.ua - крім кодування - жодної вказівки про мову на сторінці (головна сторінка російською)
- ukr.net - тільки кодування (головна сторінка російською)
- pravda.com.ua - <meta http-equiv="Content-Language" content="ru" /> Українська версія містить такий тег
- ua.korrespondent.net - <html xmlns="http://www.w3.org/1999/xhtml" lang="ua"> Спроба є, але помилка! Немає такої мови 8(
- volia.com - українська частина - жодної згадки про мову (кодування лише)
- online.ua - жодної згадки про мову (на сторінці є і українські блоки і російські)
- kyivstar.net - <body lang="ua" є спроба, але мови такої не існує! 8(
- kharkov.ua - паразітєльньій домен - <meta NAME="Content-Type" Content="text/html; charset=koi8-u"> , на вебсторінці жодного українського слова, але назва Welcome to Kharkiv! і є лише російський та англійський варіанти...
- о! знайшов... linux.org.ua - <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="uk"> Дві години шукав хоч один сайт, де коректно вказано. Знайдете ще - підказуйте.. Буду вписувати в "зал слави". Повага власникам сайту від мене особисто.
- Українські блогери. Ситуація чесно кажучи мало чим відрізняється... Перерахую деяких
- laset.info - немає вказівки про мову ніде. Випадково натрапив на цікаву штуку в коді
- <a target="_blank" rel="nofollow" href="http://www.feeds.com.ua/"><img src="http://www.laset.info/wp-content/themes/laset/images/folder_feed.png" title="Friends" alt="Friends" border="0"></a> Friends і nofollow в одному флаконі... Сила!
- andyway.com.ua - немає вказівки про мову і аналогічна ситуація з nofollow. Ну ні з ким не дружимо!
- blogobig.com - домен хороший, але про мову згадки немає... Мабуть англійська
- blogoreader.org.ua - <meta http-equiv="content-language" content="ua" /> спроба є, але мови такої немає 8(
- hellveen.blogspot.com (і всі на blogspot) - жодної вказівки на укр мову... Напевне англійська, бо домен же англійський
- hip.org.ua - <meta http-equiv="content-language" content="ua" /> це повально! 8(((
- ribel.org.ua - <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="uk"> супер! Перший знайдено
- rip.in.ua - кодування utf-8 не розповість роботам про мову на сторінці 8(
- povnyi.bezpredel.com - мабуть друг rip.in.ua - все аналогічно
- fireon.org.ua == rip.in.ua
- localize.in.ua - сіра мишка із юнікод кодуванням (показово, правда?)
- www.lordproteus.org.ua - українське ядро, але немає вказування мови
- blog.management.com.ua - <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
- www.blog.lviv.ua - невідома мова 8(
- kinoblog.com - unknown
- design.bohdan.com.ua - мови нема 8( веброзробником називається 8(
- www.mustang.te.ua - no lang
- zagadki.org.ua - без мови
- electric.org.ua - без мови
- dyn.org.ua - без мови
- nadia.blog.net.ua - без мови
- zlet.lviv.ua xml:lang="en" lang="en"> - мдя
- klaptiki.com.ua - <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ua-UA"> також помилка! uk-UA вірно
- volodymyr.pavlyuk.lviv.ua - <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> Вказано правильно! Але на сторінці чомусь англійської мови мало бачу 8(.
- втомився.я.дивитись.на.укрблоги.in.ua
- laset.info - немає вказівки про мову ніде. Випадково натрапив на цікаву штуку в коді
- Проблеми CMS із HTML
- Wordpress - відома платформа. Дуже багато його використовують. І тем для нього багато... І локалізований він дуже добре. Але то лише для користувача. Для робота - як був буржуйським, так буржуйським і залишається. Тому необхідна правка коду ( питайте ribel.org.ua ).
- Drupal - тут все ок. Ставимо в параметрах мову - так він навіть теги в XML (rss, atom) коректно проставляє, не кажучи про HTML(але при умові використання офіційних тем)
- Typo3 - хороша система! Мусите вручну вказувати коректно мову своїх сторінок, бо по замовчуванню - англійська
- reloadcms - написаний Українцями - проблем жодних.
- LP - українське ядро, але стадія альфо-бета, ще купу недоробок, проблема з вказуванням мови
- Окремим пунктом вкажу non-standalone блоги. Liveinternet та ЖЖ - там ситуація аналогічна! Ніхто не буде вказувати укр мову.. Тому будете проходити по всіх пошукових системах як російська (в кращому випадку).
- Проблеми XML.
- Тихий такий недолік. Крім Drupal та ReloadCMS в цей код жоден з відомих мені CMS не прописує тег мови правильно туди 8(. А дана технологія дуже глибоко використовується саме роботами! Щоб всі були впевнені - пройдусь по блогам.
- ribel.org.ua - <language>en</language> Всі Wordpress так роблять...(перебирав багато українських - не знайшов коректного 8( )
- всі сайти через feedburner <language>en</language>
- LP - віддає тег англійської в XML
- коректний варіант на моєму блозі, та у всіх блогах reloadcms - <language>uk</language>
- XML передається також через трекбеки, а це вже вказівник на вас, і робот сприймає цей вказівник саме некоректною мовою. Приклади шукайте самі в своїх кодах по ключовому слову rdf
- Тихий такий недолік. Крім Drupal та ReloadCMS в цей код жоден з відомих мені CMS не прописує тег мови правильно туди 8(. А дана технологія дуже глибоко використовується саме роботами! Щоб всі були впевнені - пройдусь по блогам.
- Проблеми пошуковиків
- Уявляємо себе на місці аналізатора вебстатистики того ж самого Ґуґла. Сидить собі така немаленька група людей і аналізує статистику зібраних сторінок за місяць. На предмет мови сторінок. Звичайно, що із таким станом речей, який маємо в україномовному сегменті Ґуґлівцям не залишається нічого, окрім присвоєння таким сторінкам російської мови... Бо вони навіть не зустрічають згадку на те, що ця мова неросійська... Не кажучи, що вона не позначена як українська.
- Знаю, що, для прикладу, Laset аналізував роботу системи AdSense, на предмет нормальності її до використання на Українських сторінках. Але я не знайшов аналізу там... Можу підказати - проблема дуже глибоко.. І вона описана мною вище. Гугль обробляє наші сторінки саме так, як ми на них вказуєм.
- Чому так багато російського спаму в українських результатах? Ось Вам і відповідь - а покажіть мені Українські сайти.
- Я тут намагаюсь заставити Yahoo (перший пошуковик на планеті згідно Alexa) розпізнати коректно українську мову в своєму пошуку (у них там насправді помилка!). Так тепер я розумію чому вони не спішать... Більше того, після проведеного мною аналізу (кілька стрічок вище дивіться) - я розумію, що список сайтів, які я назвав "українськими" на їхній панелі пропозицій по вдосконаленню - не є українським. І не здивуюсь, якщо вони то не пофіксять. Для них - немає фактів. Стандарт w3c.org - не збережено.
- Висновки - робіть "любі друзі" самі.
Мій маленький висновок - проблема не в пошуковиках! Ніхто із Українського сегменту не намагається дотримуватись стандарту, який описано в офіційному документі
А це означає лише одне - всі наші сайти - серйозна проблема в російському пошуку, в той час як Українського пошуку на сьогоднішній день НМД - не існує
Нагадую Всім Україномовним
творцям
- Для вказування принадлежності тексту до Української мови використовуйте параметр lang="uk" (найбільш універсальне!)
- для вказування Української мови в Україні - lang="uk-UA"
- для вказування Російської мови в Україні - lang="ru-UA"
Все інше - некоректно і не буде підтримуватись ніким! Бо це відступання від стандарту!
Успіху Вам!
PS. Всі згадані вебсайти і блоги вибрані мною максимально уважно і коректно. Не хотів нікого образити - я просто приводжу приклад проблем на цих сайтах. Більше того - візьмусь допомогти безкоштовно в виправленні цих помилок як провізор.
Далі буде...