a direct publicism site
personal pages of Yasen Pramatarov

captcha

reCAPTCHA - невидимите ресурси


Всяко действие днес носи със себе си последствията на един цял нов свят, утрешния. Има толкова много неща, които наричаме “ежедневни”, “рутинни” - все неважни неща, подробности. Които стават пречки, ако им се обърне внимание. Но защо? Може би истински ценното действие е откриването на светоизграждащата отговорност в най-малкото и ежедневно нещо?

Всеки ден из сайтовете се попълват над 60 милиона “captcha”, изписване с букви и цифри на изрисувани знаци. Често се ползва като защита от нежелани коментари в блоговете, или пък при регистрацията в разни търговски портали. Толкова е просто, нали - нарисувана е думичката, ти трябва да я напишеш с букви от клавиатурата, за да докажеш, че не си някоя тъпа програма и можеш да четеш и смяташ, човек си.

Над 60 милиона пъти дневно хората доброволно цифровизират данните от изображения. Средно по десет секунди - това прави 150 000 работни часа дневно. И трудът им отива нахалост.

Идеята “reCAPTCHA” е този ресурс да се използва. С участието в инициативата хората помагат да се разчитат правилно сканирани стари книги от подпроекти на Internet Archive.

Много често при сканиране на книги се получава лош или нетипичен графичен резултат и последващото оптично разпознаване е неправилно, неуспешно. Компютрите не винаги могат да OCR-нат целия текст - това знае всеки, който поне веднъж е опитвал да сканира и разпознава текст. Човешката намеса е неизбежна, дори и да е за сравнително малки редакции.

Проектът “reCAPTCHA” взема такива неразпознати думички от сканираните за Интернет-архива книги и ги изпраща на съответния потребителски сайт, където работи приставка за reCAPTCHA. Непознатата дума се изпраща в комбинация с вече разпозната такава - така се гарантира в голяма степен, че човек, а не спам-машина ще въведе решението и то ще го въведе правилно.

Има вече налични приставки за WordPress, MediaWiki и phpBB. Също така е публикувано и API за тези, които искат сами да си внедрят поддръжката. Взех леко да завиждам на хората с WordPress - все още няма за Drupal.

Някои идеи са очарователни с простотата и логичността си. И все си казваме “е как никой не се е сетил досега”.



Tags:
25 Май, 2007 - 20:33

 
 

Анти-спам мерки


Днес ми се наложи да се позанимая със системата на сайта. Все си казвам, че имам дизайн за изчистване и украсяване, а пък то какво стана. Новият ми хостинг и той се издъни - ICN.bg са по-добри за мен в момента единствено защото са евтини. Точно сега не искам да си позволявам излишни разходи, затова се преместих в началото на годината. Мога да кажа, че лично аз не съм доволен от услугата, но все пак като се сравнят цените, за парите си е достатъчно добро нещо. Нищо повече, нищо особено, на моменти ужасно дразнещо, неудобно и тясно, но пък евтино. Опитвам се да “задържам” сайта си на този хостинг.

Като казвам “тясно” нямам предвид дисковото пространство или трафика - вече е нормално да не се стяга такава примка около врата на клиента. Говоря за това, че ограниченията за ползваните системни ресурси са прекалено ниски. От няколко дни забелязвам, например, че привечер се спира достъпът до SQL-услугата заради превишаване броя на едновременните връзки. Много е досадно изведнъж сайтът ти да изчезне съвсем заради превишаване границите на тъпите “споделени хостинги”.

Предполагам, че многото връзки са дошли от спам. Но е възможно и доста читатели да е имало точно тогава. И двете неща са нормални. It comes with the territory.

Уцелих момент, когато пуснаха сайта и влязох да го превключа в режим на поддръжка. Докато попрегледами настроя някои неща. В сайта остават всички активни раздели - дневник, фотодневник, галерии със снимки, уики-страници, библиографски данни. Между другото, можете да добавяте в библиографията, като си регистрирате профил. Също с профил можете да пишете в уики-раздела, но за това ми напишете какво ще превеждате и т.н. - може през формата за контакт.

Това, което засега временно е спряно, са trackbacks. През цялото време съм получил само три свързвания. Възможно е да не са работили правилно, а може и просто никой да не ме е свързвал - и в двата случая вярвам, че няма да ни липсват много.

Новото нещо пък е текстово captcha за коментарите. Не съм привърженик изобщо на картинките с текст - не са удобни за незрящите, а и много загрозяват изгледа и затрудняват работата със сайта. Текстовото поле ще поспре поне част от спам-а още преди входа. Akismet и локален филтър се грижат за пресяване след въвеждането, но имаше нужда от нещо за намаляване на шума в началото.



Tags:
14 Март, 2007 - 20:10

 
 
Different Photography
Make Money Fast - Work At Home
helio ocean
Cheap Macs, PCs, LCD TVs etc
Flash Drive Recovery
Ако сайтът ви е харесал, можете да ме почерпите с
или
през ePay
perdolitical manager good job trachilic
money cash casinos