Google купил reCAPTCHA

Вездесущий Google совершил очередную громкую покупку. На сей раз web-гигант обратил свой взор на сервис reCAPTCHA, который совмещает в себе обычную «капчу» (защиту от спам-ботов) и проект про распознаванию элементов текста, неподдающихся классическому OCR-распознаванию.

recapcha

С «капчей», я думаю, встречались почти все (reCAPTCHA используется, например, на «Баше»). А вот на второй части стоит остановиться подробнее.
Работает всё примерно так. В качестве защитного кода пользователям выводятся два текстовых фрагмента из отсканированных документов. Одно из слов заведомо распознано — и именно оно выступает ключом. А вот второе — «трудный» образец, распознать который ранее не удалось. Пользователи, вводя свои варианты написания этого «трудного слова», нарабатывают для системы статистику, и как только reCAPTCHA сможет уверенно определить, что же собой представляет «трудное слово» (с нашей помощью), она вносит его в свою базу. Таким образом, все пользователи сервиса помогают делу перевода в цифровой вид различных книг и документов. Как вы понимаете, второе слово в защитном коде такой капчи вовсе не обязательно писать верно — ключом является лишь одна половина кода.
Как известно, Google уже довольно давно ведёт собственный проект по переносу в электронную форму старых книг и периодических печатных изданий. По всей видимости, теперь на этом поприще будет служить и reCAPTCHA. Остаётся только надеяться, что на удобстве сервиса факт покупки не скажется.


Рекомендуем почитать: