Google, ReCaptcha contro spam ed errori

Sep 17, 2009 | Category: Google

Google ha rilevato la proprietà di ReCaptcha, sistema che mette le procedure di login ai servizi online a disposizione dei sistemi di scannerizzazione: l’occhio umano è in grado di aiutare gli OCR ad interpretare quelle parole che il sistema non riconosce

L’idea è geniale, e Google l’ha fatta propria. Per una somma non meglio precisata, il gruppo ha infatti acquisito il gruppo ReCaptcha, piccola start-up che da tempo porta avanti una semplice idea in grado di coniugare l’esigenza di bloccare i bot dello spam con la necessità di offrire un aiuto umano al lavoro degli OCR che trasformano i libri stampati il bit. Su Webnews se ne parlò già il 25 maggio del 2007, quando ancora la digitalizzazione dei libri era agli albori: ReCaptcha faceva capolino online attirando molte attenzioni, fino a giungere a due anni di distanza alla cessione dell’idea per farla fiorire sui server di Mountain View.

http://www.blogcdn.com/www.downloadsquad.com/media/2008/04/recaptcha-email.jpg

Il Captcha è un sistema noto, utile a certificare il fatto che l’accesso ad un sito sia stato compiuto da una persona fisica piuttosto che da un bot. Questi ultimi, infatti, tentano di accedere a sistemi quali Gmail per offrire a malintenzionati uno strumento utile all’invio di grosse quantità di spam. I sistemi Captcha, però, sono dovuti cambiare nel tempo poiché le tecniche di violazione si son fatte sempre più raffinate ed il gioco a “guardia e ladri” si sussegue ormai da tempo. Il sistema che meglio sembra funzionare è la proposizione di parole distorte che l’occhio umano è in grado di identificare con facilità, ma che un bot difficilmente riuscirà a riconoscere. ReCaptcha va un passo oltre, proponendo parole non solo distorte, ma parole la cui soluzione può avere anche una successiva utilità.

Ciò che ReCaptcha si propone di fare, infatti, è raccogliere tutti quei lemmi che i software OCR non sono riusciti ad identificare con chiarezza, proponendoli quindi agli utenti e chiedendo loro di identificarli per avere accesso al login del caso. L’aiuto dell’occhio umano è in grado di portare la precisione delle digitalizzazioni al 99.5%, migliorando in modo sostanziale il margine d’errore proprio dei sistemi OCR tradizionali. Con l’acquisto di Google l’orizzonte si fa chiaro: ReCaptcha verrà adottato su alcuni dei servizi del gruppo, portando così sotto gli occhi di milioni di utenti le parole che l’OCR non è riuscito a identificare in fase di scannerizzazione dei libri da portare su Google Books.

From: http://www.webnews.it

Related posts:

  1. Google contro i bot: Il CAPTCHA ora ruota
  2. Lo spam compie trenta anni, ma chi lo festeggia?
  3. Google aiuta a risolvere gli errori 404
  4. Hotmail e Gmail a rischio diffusione spam
  5. Spam: una falla mette a rischio Gmail

Bookmark and Share
Permalink Comments (0) Sep 17, 2009

Leave a Reply with your Google Account