RECAPTCHA

ikona
Tento článek potřebuje úpravy.
Můžete Wikipedii pomoci tím, že ho vylepšíte. Jak by měly články vypadat, popisují stránky Vzhled a styl, Encyklopedický styl a Odkazy.
ikona
Tento článek potřebuje aktualizaci, neboť obsahuje zastaralé informace.
Můžete Wikipedii pomoci tím, že ho vylepšíte, aby odrážel aktuální stav a nedávné události. Historické informace nemažte, raději je převeďte do minulého času a případně přesuňte do části článku věnované dějinám.
reCAPTCHA
Logo
VývojářGoogle
První vydání27. května 2007
Webwww.google.com/recaptcha
Některá data mohou pocházet z datové položky.

reCAPTCHA je bezplatná služba, která pomáhá s digitalizací tištěných médií jako jsou knihy nebo časopisy. ReCAPTCHA systém byl vyvinut na Carnegie Mellon univerzitě v USA, která používá jako základ CAPTCHA systém. reCAPTCHA aktuálně pomáhá s digitalizací archívu New York Times. Dvacet let archivu New York Times již bylo zdigitalizováno a zbývajících 110 let má být zdigitalizováno pomocí reCAPTCHA do roku 2010.

Systém uvádí, že zobrazuje 30 milionů OCR obrázků každý den (údaj z prosince 2007) a systém reCAPTCHA je používán weby jako Twitter, Facebook nebo TicketMaster.

Vlastní činnost systému

Příklad reCAPTCHA, obsahující slova “following finding”.

Naskenovaný text je podroben analýze dvou OCR programů – v případě, že se programy neshodnou, je nejasné slovo převedeno do CAPTCHA. Toto slovo je poté zobrazeno pro kontrolu se slovem již známým. Systém je nastaven tak, že pokud člověk napíše kontrolní slovo v pořádku, nejasné slovo je poté také správné. Identifikace OCR programem je ohodnocena hodnotou 0,5 bodu a každá interpretace člověkem má hodnotu jednoho bodu. Jakmile hodnota identifikace slova dosáhne 2,5 bodu, je poté slovo považované za správně identifikované.

Externí odkazy

  • Logo Wikimedia Commons Obrázky, zvuky či videa k tématu reCAPTCHA na Wikimedia Commons
  • Web projektu reCAPTCHA