Google и другите големи в бизнеса с уеб-търсенето Yahoo и Microsoft (Live) обявиха официалната си подкрепа за т.нар. “canonical URLs“. Това са такива адреси, които са маркирани за идентичност и позволяват до голяма степен да се намали дублираното съдържание. Да, знам — мъгляво и неточно казано е, но не искам да изпадам в подробности. Основното е, че 1) наистина един от големите проблеми на смисловата свързаност на мрежата е точно дублирането и 2) “големите” си дават вид, че си плюят на ръцете да се справят с този проблем.
Това само по себе си е голяма новина. Дали ще отреже спам-сайтовете с бръснач? Дали ще позволи най-накрая проектите за semantic web да минат в най-лявата бърза лента? Не зная. Даже се съмнявам, защото за такава промяна трябва canonical urls да са наистина масови. Нещо повече, дори да е проблем да ги нямаш в сайта си. Малко съм черноглед, защото това изобщо не е първият технически опит за удържане смисловата цялост на уеб-а. Или на Интернет изобщо, не само на уеб. Например и днес има SPF-записи в пощенските сървъри, но ползват ли се масово? Да, преди време същите тези Google включиха в пощенската си услуга Sender Policy Framework. И какво от това? Спамът си продължава, а е-пощата продължава да е едновременно най-уязвимата и най-ползваната услуга. Хората говорят за прехвърляне на тази комуникация към XMPP от години, но няма резултат, защото в XMPP спамът може да се контролира. А спамът е един от най-маститите интернет-бизнеси, включително и у нас. Нещо повече — в уеб може би това е най-сладкият и гарантиран приход.
Интересното в това е, че клиентът винаги може да премахне спама от полезрението си (поне в достатъчна степен), но продължава да има много пари в цялото това занимание… Всъщност точно тези “големи играчи” нямат голяма полза от спирането на спама. То е като с вирусите и антивирусните програми. Има начини да няма вируси, но каква печалба имат тогава антивирусните фирми? Да казваме директно, че точно те в повечето случаи провокират писането или дори пишат въпросните вируси е в обсега на недоказуемите конспиративни теории. И все пак…
Но може би за пореден път получаваме косвено доказателство, че Google се е превърнал в недосегаем монополист в основния му бизнес, рекламите. Никой не се заблуждава, че Google е услуга за поща или онлайн-календар, да речем. И търсачката, която е най-използваемият им продукт (за някои е и единственият), е в някакъв смисъл само инструмент за генериране на печалби от рекламите.
Въпросното доказателство е въвеждането на две неща — canonical urls и профилираните реклами. Два хода, случили се доста скоро един след друг, които показват, че Google може да си позволи да работи срещу “класическия” спам. Но в името на един нов вид спам, спамът, който може пък и да ни харесва, който може дори да ни е и полезен — таргетираната реклама.
Някой ще каже “и какво от това, нали не сме против рекламите, а само против спам-а”. Всъщност е въпрос на гледна точка. Спам-ът е вид реклама. Вярно, наложил се е като нежелана реклама. А и на практика всичките видове явни реклами, включително целият спам и цялата система с контекстни реклами могат да бъдат спирани, отрязвани и неполучавани от клиента.
Но не е ли малко странно, че за свързаността на масовия уеб се работи най-вече през реклами? След като дублирането на съдържание и спамът са неща, които не могат пряко да попречат на смисъла в уеб, макар и да са тежък удар върху категоризирането, не е ли странно, че точно тези проблеми се атакуват? Много по-ценно за автоматичното категоризиране на съдържанието би било, например, работа по проблема със счупените и изтекли линкове, т.нар. “link rot“. За това работят на практика само archive.org и някои от сайтовете за социални отметки (напр. Furl). Е, там няма толкова парички от реклами, колкото в търсачките. Които винаги се ползват и където лесно се смесва търсено съдържание с платени реклами. Особено ако са “таргетирани” и лека-полека ни се харесват.
Canonical URLs са хубаво нещо иначе. Да видим и дали ще се внедрят достатъчно масово в близките години, че да има ефект и някакъв смисъл от тях.
1) Монопол
Като казвам, че има проблем с монопола върху рекламите в Интернет, то е, защото средата на тези реклами е една. Интернет е един, това е смисълът му — да е “един”, да е общото сработване на мрежи със всякакво съдържание и от всякакъв вид и с всякакви протоколи.
Ако сравним Интернет с медиите (аз съм против за блоговете да се казва, че са медии, защото те са публицистика без посредник — всичко останало е медийна среда, ок), то монопол върху рекламите в Интернет е като това да имаме една телевизия и реклами в нея. Ако при медиите може просто да се иде в съседната медия или в медиите на съседна държава и т.н., то в Интернет това не сработва, защото няма къде да се отиде другаде.
По медийните стандарти Google вече отдавна да е наказан за монопол. В Интернет стандартите са по-други. И все пак…
2) Бизнес модели
Притеснението, че за смисъла се грижим основно през рекламите може да стои неадекватно за някои. Днес е нормално всичко да се мисли откъм цената му, а рекламите са начин за осребряване на медийната среда — значи защо не и на Интернет като среда.
И все пак да припомним, че има и други модели, освен рекламите. Уикипедия, например, се издържа от фондация, която всяка година успява да събере достатъчно дарения за издръжката и дори за развитието на продуктите си. Да се разчита на дарение не е несериозно и не е срамно. Не е някакъв вид уеб-просия. Обратното — много по-щадяща потребителя схема е и много по-достойна за него.