Капчи: зачем они нам нужны, как они развиваются и как их легче решать

Как люди, живущие в современном мире, мы должны довольно часто заявлять, что мы не роботы, и мы даже не живем в какой-то футуристической научно-фантастической антиутопии. Независимо от того, устанавливаете ли вы флажок "Я не робот", обучая ИИ тому, что представляет собой "знак" (Подсказка: "правильный" ответ - это то, что выбрало большинство других пользователей; постарайтесь думать как толпа ) или решение математических задач, цель всегда одна: не дать ботам испортить веб-сайты и, возможно, использовать людей, решающих капчи, для оцифровки некоторых книг, обучения программного обеспечения для распознавания изображений или получения дохода от рекламы. Но капчи - это больше, чем кажется на первый взгляд, и они далеко не надежны.

Зачем нужны капчи?

CAPTCHA означает " полностью автоматизированный общедоступный тест Тьюринга, чтобы отличить компьютеры и людей друг от друга", который, помимо того, что является действительно элегантной аббревиатурой, сообщает вам большую часть того, что вам нужно знать. Идея, как гласит девиз Google reCAPTCHA, состоит в том, чтобы создать задачу, которая будет "Легко для людей, сложно для ботов".

капча-тест Тьюринга

"Бот" обычно относится к любой программе, которая настроена на автоматическое завершение какого-либо процесса, будь то публикация новостей в Twitter или спам в разделах комментариев веб-сайта. При правильном использовании эти программы довольно полезны, но их также можно использовать для создания бесполезного / наполненного рекламой / вредоносного контента, заваливания сайта подписками, фальсификации результатов онлайн-опросов, очистки адресов электронной почты или выполнения любых других неприятных вещей. Просто лучше не впускать их.

Что такое капча?

искаженный-текст

Если вы какое-то время знакомы с Интернетом, то помните, что на протяжении большей части 2000-х наиболее распространенным типом капчи была полоса искаженного текста с некоторой строкой буквенно-цифровых символов в ней. Это уже не очень безопасная форма капчи, но когда Google приобрела reCAPTCHA в 2009 году, ее все еще было достаточно, чтобы получить большинство ботов. С тех пор Google перешел на более безопасные ящики "Я не робот" (которые фактически отслеживают поведение, такое как движение мыши и информацию браузера, чтобы проверить, бот ли вы) и задачи распознавания изображений. Тем не менее, звуковые капчи все еще существуют, и их на удивление легко взломать с помощью программного обеспечения для распознавания речи.

captcha-image-id

Капчи распознавания изображений имеют свой собственный набор проблем, поскольку они могут быть немного двусмысленными для респондентов-людей. Однако, как упоминалось выше, нет правильного ответа - поскольку компьютер не знает, какие изображения являются витринами, а какие - шнауцерами, - он просто принимает мнение большинства людей как правильное. Если 75/100 человек решат обозначить расплывчатое изображение швабры шнауцером, компьютер будет считать, что швабра - это шнауцер, и ошибочно отметит вас, если вы не обозначите его как таковой.

Но есть много других вариантов ввода капчи, и они могут быть довольно креативными. Это лишь некоторые из идей, которые нашли отражение на различных веб-сайтах.

Капча с слайд-замком:

captcha-slidelock

Капча для математической задачи:

капча-математика

Капча с перетаскиванием:

капча-головоломка

Капча ориентации изображения:

капча-ориентация

Логическая / грамматическая капча:

капча-яичный клей

Есть также некоторые капчи, которые вы никогда не видите, например, капча-приманка, которая включает в себя добавление невидимого поля на веб-страницу, ожидание, пока бот заполнит его (люди не будут, поскольку они не могут его видеть), а затем отключение бота. Затем есть "невидимая капча" Google, часто в сочетании с их окном, которая наблюдает за тем, как вы просматриваете веб-страницу (движения мыши, прокрутка, щелчки, общее поведение), чтобы увидеть, должна ли она выдавать вам капчу распознавания изображений в качестве двойной проверки. .

Капчи: делаем мир лучше

Возможно, вы этого не знаете, но совокупные часы, которые вы потратили на то, чтобы доказать, что вы не робот, могли действительно иметь значение. reCAPTCHA, ныне служба ввода символов Google, была первоначально разработана Луисом фон Ан (теперь более известным как основатель Duolingo) как способ использовать потраченные впустую ресурсы для оцифровки книг. Предоставляя пользователям отсканированное слово из книги или газеты, эта система могла как подтвердить личность пользователя, так и провести своего рода опрос мнения о том, что это за слово. Если достаточное количество людей согласятся со словом, система оцифровки примет ответ в версию электронной книги.

После внедрения этой системы потребовалось всего два года, чтобы оцифровать всю библиотеку Google Книг и весь архив New York Times. К 2012 году они перешли на использование людей для ввода номеров домов, взятых из Google Street View.

оцифровка капчи

В 2014 году ситуация приняла иронический оборот в сторону роботов: капчи для распознавания изображений. Они работают по тому принципу, что машины не очень хороши в понимании того, что изображено на картинке, но, как описано выше, они довольно эффективно обучили ИИ именно этому. Поскольку эта капча в конечном итоге перестанет работать, от нее постепенно отказываются в пользу менее заметных поведенческих / ориентированных на отслеживание.

В заключение: я робот?

По мере того, как в ближайшие несколько десятилетий искусственный интеллект, глубокое обучение и множество других достижений будут реализованы, капчи также должны будут развиваться. Большинство существующих капч уже взломаны, и это становится только проще. Обучение машины чтению кодов с искаженным текстом теперь занимает около пятнадцати минут. Возможно, единственное, что останется в будущем, это биометрические капчи (надеюсь, вам понравятся сканирование с распознаванием лиц!), Или, возможно, мы проснемся и обнаружим, что сингулярность уже достигнута, и мы все время были ботами.

Изображение предоставлено: Chippee через плохие номера домов в Google Recaptcha

6 комментариев

  1. Думаю, я, должно быть, робот. С тех пор, как появились капчи с распознаванием изображений, я еще не смог успешно решить ни одну. :-) AFAIAC, ничего страшного. Если они не хотят впускать меня, это их потеря, а не моя. Есть десятки других подобных сайтов, которые не так строго охраняют свою добродетель. Я не собираюсь полчаса баловаться, чтобы попасть на какой-нибудь сайт сомнительной ценности.


    Да, капчи для распознавания изображений - это выход - сначала они были трудны для роботов и трудны для людей, теперь они легки для роботов и все еще трудны для людей. Если вы видите сайт, использующий его, это может быть признаком того, что он не успевает за тенденциями в области безопасности и еще не имел достаточно серьезной проблемы с ботами, чтобы спровоцировать их на обновление.

  2. Я считаю, что у меня катаракта в одном глазу, а в другом - искусственный хрусталик. Как я выяснил, визуальная CAPCHA трудна для слабовидящих. Поскольку они не охвачены Американским Законом об инвалидах, я все же хотел бы "увидеть их получше" или использовать другой метод. В этой статье были некоторые из тех, чего я никогда раньше не испытывал, что было бы легче для меня с проблемами зрения.


    Если вы просматриваете Интернет без расширений конфиденциальности или VPN, скорее всего, в следующие несколько лет вы будете все реже и реже сталкиваться с капчами, так что вам повезло! Большинство капч сейчас невидимы, они используются для проверки ваших роботизированных качеств, и вскоре они, вероятно, получат более широкое распространение.

  3. Не обманывайтесь этой игрой.

    Recaptcha от Google используется не ТОЛЬКО для идентификации ботов, но ТАКЖЕ для идентификации людей во всей сети.

    Рекапча - это глубокое обучение искусственного интеллекта, и нет оправдания тому, чтобы включать его повсюду, в том числе в видеоигры для ОДИНОЧНОЙ ИГРЫ, такие как Max Payne 3.

  4. "… Сингулярность уже достигнута, и мы все время были ботами".
    Я могу доказать, что вышесказанное верно, и Google был одержим отслеживанием меня ВРУЧНУЮ и алгоритмически в течение 3 лет. Они одержимы тем, чтобы всегда знать все, что я знаю, и заставляют крупнейших пользователей YouTube делать "фальшивые новостные видеоролики", основанные на моих выводах и моих попытках обнародовать их. У них Роберто Блейк изображает меня другом, но на самом деле он шпион. Они делают гораздо больше. Обновление "Не нравится" из-за меня. Удаление геоданных из новой бета-версии студии произошло из-за меня. … И многое другое. пожалуйста, подпишитесь, но напишите мне для получения дополнительной информации по этой теме. Я больше не снимаю видео на эту тему из-за негативного влияния, которое они оказывают на мир ... из-за преимущества, которое они дают нашим рабовладельцам ... Google (или кто-либо еще контролирует все это)

Комментарии закрыты.