История о том, как многие из нас успели помочь “The New York Times” и “Google”, или... Немного о CAPTCHA

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Начало 2000-х: сетевые боты только начали появляться, но разработчики подготовились с ними сражаться...

И именно в 2000 году появился первый "фейс-контроль" для посетителей некоторых сайтов — технология CAPTCHA, широко известная в узких кругах, как...

Completely Automated Public Turing Test to tell Computers and Humans Apart — "полностью автоматический тест Тьюринга, разделяющий компьютеры и людей".

=====

Бот-системы могли перегружать сайты, делая их недоступными для живых людей. Так, например, на форуме без капчи в начале нулевых можно было автоматически зарегистрировать десятки тысяч фейков и заспамить форум.

Для борьбы с такими ситуациями в американском Университете Карнеги-Меллона придумали скрипт, который требовал при доступе к сайту ввести символы с трудноразличимой картинки.

Для пользователя ребус был несложный: буквы, раскиданные по изображению в хаотичном порядке и искаженные помехами, легко считывались человеком. Зато компьютерные системы распознавания текста терялись.

Когда "капчу" стали использовать чересчур часто, сообщество задумалось о более полезном применении технологии. В 2007 году появилась reCAPTCHA, где вместо абстрактных картинок нам показывали нераспознанные слова из сканов архивных выпусков газеты "The New York Times".

Аудитория теперь не расшифровывала тарабарщину, а помогала оцифровывать бумажную прессу XX века. Подтвердил, что ты человек, а заодно добавил слово.

Вскоре технологию купила "Google" и использовала ее для оцифровки книг: сложно представить, но в день пользователи помогали распознать до нескольких миллионов слов.

Со временем боты научились автоматически распознавать текстовую reCAPTCHA, и тогда "Google" выпустила принципиально новый алгоритм проверки с девятью картинками, но... Это уже совсем другая история :)

Комментарии: