CAPTCHA che fare?

Tutti abbiamo avuto a che farci almeno una volta nella nostra vita di internauti. Tutti ci siamo imbattuti in un CAPTCHA, uno di quei codici alfanumerici che si trovano in alcuni form di iscrizione a social network (come Facebook, ad esempio), forum, o servizi online. Scritti nella maggior parte dei casi in maniera sgangherata e poco comprensibile, servono a distinguere se dall’altro capo del cavo Ethernet si nasconde una persona in carne ed ossa oppure un bot.

La storia

I codici CAPTCHA sono stati concepiti e sviluppati nel 1997 all’interno dei laboratori di ricerca di AltaVista, tra i primi motori di ricerca a passare in rassegna il web. L’obiettivo era quello di creare un sistema per impedire a bot o altri script informatici di inserire risultati fasulli all’interno delle ricerche del motore. Gli ingegneri, quindi, presero tra le mani il manuale di istruzioni di uno scanner presente nei loro laboratori e, dopo aver scansionato il testo, iniziarono a deformarlo per renderlo illeggibile o quasi. In questo modo, sostennero in seguito gli ingegneri del team di sviluppo, si registrò una riduzione dello spam del 95%.

Sulla primogenitura del codice, però, c’è ancora qualche diatriba. Alcuni, infatti, sostengono che a inventarlo sia stato realizzato da un gruppo di ricercatori indipendenti dal team di AltaVista, che ha brevettato il sistema nel 1998.

Cosa sono i codici CAPTCHA

Per capire cosa sia un codice CAPTCHA bisogna prima di tutto partire dal nome. CAPTCHA, infatti, non è una parola priva di senso, ma un acronimo piuttosto lungo ed esplicativo. CAPTCHA sta per Completely Automated Public Turing test to tell Computers and Humans Apart, ovvero Test di Turing completamente automatizzato e pubblico per distinguere computer dagli umani.

Volendo entrare nello specifico, un CAPTCHA è un programma che protegge siti web da bot e altri script informatici generando dei test risolvibili da umani (magari con una seppur minima difficoltà) ma non da programmi per computer.

images-captcha

Questi test vengono quindi utilizzati per impedire che computer e bot utilizzino determinati servizi web oppure entrino in possesso di informazioni riservate. Questa tecnica di sicurezza informatica può essere utilizzata, ad esempio, nel caso di sondaggi online, nei form di iscrizione a servizi di posta elettronica o social network e per inviare messaggi sulla Rete.

I codici CAPTCHA, inoltre, possono prevenire la diffusione dello spam. Richiedendo al mittente di inserire un codice per ogni messaggio che intende inviare, si potrà impedire l’invio automatizzato dei messaggi tipico dei bot spammer (script informatici che permettono di inviare migliaia di messaggi di posta elettronica alla volta in maniera completamente automatica).

Come funzionano i CAPTCHA

Un codice CAPTCHA è solitamente formato da due stringhe alfanumeriche, di lunghezza variabile. La particolarità sta nella maniera in cui queste due stringhe vengono “stampate a video“: le lettere sono distorte e semi-cancellate, così da renderle difficilmente comprensibili ad occhio umano e praticamente indecifrabile per un qualsiasi software.

Per riuscire a superare il test, bisognerà trascrivere esattamente le stringhe all’interno del campo posto immediatamente sotto l’immagine. Nel caso in cui non si sia commesso alcun errore, si potrà usufruire del servizio; nel caso in cui si sia sbagliato a inserire anche un solo carattere (i codici sono case sensitive, e distinguono quindi tra lettere minuscole e lettere maiuscole), comparirà un nuovo codice CAPTCHA da inserire.

Un’evoluzione di questa tipologia di codici per la sicurezza informatica è il cosiddetto reCAPTCHA. Sviluppato da Google, non solo garantisce alti standard di sicurezza, ma permette anche di digitalizzare il patrimonio librario mondiale. Le stringhe alfanumeriche utilizzate in questa versione del CAPTCHA, infatti, altro non sono che parole e numeri tratte da libri antichi e rari (presenti in Google Books), vecchi giornali (come le copie dell’archivio storico del New York Times) o copioni di vecchi show radiofonici. Un modo, insomma, per conservare la cultura e tramandarla alle future generazioni.

L’evoluzione del reCAPTCHA

Con il passare degli anni, e l’affinarsi delle tecniche e degli algoritmi per riconoscere utenti in carne e ossa da bot che navigano online, i codici CAPTCHA (e il reCAPTCHA di Google in particolare) sono andati incontro a una vera e propria rivoluzione che ha cambiato profondamente il modo in cui li utilizziamo.

images-re-captcha

Nella prima versione del test, per riuscire ad accedere alla risorsa richiesta l’utente doveva inserire una stringa alfanumerica – a volte anche di senso compiuto – generata automaticamente dal software. Questo sistema è ancora oggi molto utilizzato e, in alcuni casi, viene sfruttato per digitalizzare risorse cartacee come libri antichi, vecchi codici e manoscritti o interi fondi letterari (vi può capitare, ad esempio, di trovarvi di fronte parole che sembrano stampate, ma in una lingua straniera o morta, come il latino). In altre occasioni, invece, l’utente deve superare dei test visivi (come riconoscere degli oggetti all’interno di alcune immagini) che consentono a chi ha realizzato il software (Google, ad esempio) di istruire intelligenze artificiali per il riconoscimento delle immagini.

Nella seconda versione del test, invece, l’unico passaggio richiesto per dimostrare di essere umano è quello di flaggare una casella in corrispondenza della scritta “Non sono un robot” e attendere qualche istante per il caricamento della pagina. Questo cambiamento è dovuto a diversi fattori, prima di tutto la miglior capacità dei sistemi di Google di riconoscere bot da internauti “reali” da semplici azioni come lo spuntare una casella all’interno di un campo.

La terza versione del reCAPTCHA, però, dovrebbe essere quella “definitiva“. In questo caso, infatti, l’utente non dovrà compiere nessuna azione, ma saranno i sistemi a intelligenza artificiale ideati dagli sviluppatori Google ad analizzarne il comportamento sul sito web e capire automaticamente se chi sta accedendo al portale è un bot oppure un utente normale. Con reCAPTCHA v3, il comportamento online dell’utente verrà valutato in maniera più o meno positiva (0=pessimo; 1=ottimo) e, da questi dati, il software riuscirà a capire se si tratta o meno di un bot. Per affinare le capacità del sistema di riconoscimento, Google suggerisce di inserire il codice CAPTCHA in più pagine: ciò consentirà al software di avere una maggior quantità di dati a disposizione e riuscire, così, a distinguere con maggior facilità quali sono i bot e quali, invece, gli utenti “legittimi“.

Precedente Come eliminare molte email da Gmail Successivo iPhone si riavvia, che fare?