Подтверди что ты не робот
LikeKIDS Докажи что ты не робот ELLO Kids
Like Kids Докажи что ты не робот запись клипа
LikeKids Это Лайк Кидс ELLO Kids
LEONA Like Me ELLO Kids
Докажи что ты не робот
LikeKIDS Будем танцевать ELLO UP
Докажи что ты не робот
Zefirki Подтверди что ты не робот
Танец Докажи что ты не робот
Студия Small People Мы вместе ELLO Kids
Детский хор академии Golden Gate Алматы ELLO Kids
Ксюша Антонова По тормозам ELLO Kids
SOPHIE Софья Федорова Музыка любви ELLO KIDS
Мария Гулевич и Федор Гесь Пора поверить в чудеса ELLO Kids
Ксюша Антонова Как Птица ELLO Kids
Полина Королева и Like Kids Тает лед
Группа LikeKids будем танцевать
Анита Шматова Косметика ELLO KIDS
Мар яна Рок Співаю Я ELLO Kids
Алина Кирчаллова Summer ELLO KIds
Лилия Ангел Мой Boy ELLO Kids
Докажи что ты Человек
LISAASIA Взрослая ELLO Kids
София Тарасова Верь мне ELLO KIDS
Ксения Коваленко Ксеша Селфи ELLO Kids
Sabina На Восток ELLO Kids
Маша Жилина Вприпрыжку ELLO KIDS
ELLO Kids 3 Обзоры клипов
ELLO Kids Обзоры клипов Эпизод 1
Алиса No Barbie No Ken ELLO KIDS
Подборка лучших детских клипов ELLO KIDS
ДОКАЖИ ЧТО ТЫ НЕ РОБОТ
Хоменко София Лето лето ELLO Kids
Докажи что ты не робот
Вокальная группа Like Kids Лауреат I степени конкурса кастинга Музыкальный LIFT
Михаил Смирнов Виражи ELLO Kids
Kain Rivers Море ELLO Kids
Дмитрий Ядыкин Женюсь ELLO Kids
Smile Kids Show 2018 2 частина
Аружан Ардак Новый Год ELLO KIDS
LISAASIA Лень ELLO Kids
Мария Гулевич Я папина дочка ELLO Kids
КЕДЫ Прекрасное далёко ELLO Kids
Нескучный возраст Не огорчайте маму ELLO Kids
The Arina Взрослая ELLO Kids
Вероника Коваленко In My Dream ELLO Kids
KinderStar Пижама пати ELLO Kids
Даша Пышная Намалюй ELLO KIDS
Дружба крепкая не разрушится
Здесь Вы можете прослушать и скачать песни по запросу Likekids Докажи Что Ты Не Робот Ello Kids в высоком качестве. Для того чтобы прослушать песню нажмите на кнопку «Слушать», если Вы хотите скачать песню или посмотреть клип нажмите на кнопку «Скачать» и Вы попадете на страницу с возможностью скачать песню, прослушать ее и посмотреть клип. Рекомендуем прослушать первую композицию LikeKIDS Докажи что ты не робот ELLO Kids длительностью 3 мин и 20 сек, размер файла 4.39 MB.
Likekids Докажи Что Ты Не Робот Ello Kids
Arbol Golden Section
Retki Merenrantaan Jippu Samuli Edelmann
Знаешь Мама Всё Равно По Ней Скучаю
A Nos Actes Manqués Live Bercy 2012 M Pokora
Bright Edges Bip Ling
Jouluyö Juhlayö Samuli Edelmann
Jyotirmayee Nayak Beloon Wala
Donna Trope Bip Ling
Kokomo The Beach Boys Royal Philharmonic Orchestra
Måneskin I Wanna Be Your Slave Ремикс
Марат Файрушин Әнкәй Мине Таңда Уят Әле
Мархаба Сәби Қап Қайтейін Cover Еділ Жансая
Mc Kalzin Mega Pra Elas Chacoalhar Feat Mc Rd Mc Bracim Mc Kalzin
Kizaru О Morgenshtern Diss Face Boulevard Depo Мстители Финал Obe 1 Kanobe Элджей
Владимир Кузьмин Моя Любовь Весь Альбом 1985 Год
Шина Полный Карман
Galloping Bip Ling
Mr Funkateer Can T Find The Funk
Magnolia Х Pump Named Slickback Gypsy Woman Remix
Mindwave Inner Sense
Baby I Am A Gangster Too Tiktok
I Walk On Guilded Splinters Zu Zu Mamou Dr John
У вас постоянно вылезает капча и достает вопросом «Вы не робот?» Зачем ее придумали и как от нее избавиться
Откуда взялась CAPTCHA?
Технология CAPTCHA (сейчас будет страшная расшифровка: Completely Automated Public Turing Test to tell Computers and Humans Apart — «полностью автоматический тест Тьюринга, разделяющий компьютеры и людей») появилась в 2000 году.
Это была первая успешная попытка установить «фейс-контроль» для каждого посетителя сайта. Сетевые боты только начали появляться, но разработчики подготовились с ними сражаться. Бот-системы могли перегружать сайты, делая их недоступными для живых людей. Так, например, на форуме без капчи в начале нулевых можно было автоматически зарегистрировать десятки тысяч фейков и заспамить форум рекламой.
Для борьбы с такими ситуациями в американском Университете Карнеги-Меллона придумали скрипт, который требовал при доступе к сайту ввести символы с трудноразличимой картинки. Для пользователя ребус был несложный: буквы, раскиданные по изображению в хаотичном порядке и искаженные помехами, легко считывались человеком. Зато компьютерные системы распознавания текста терялись. Такой простейший барьер позволил значительно снизить нагрузку на популярные сайты, а также защитить многие порталы от фейковых регистраций и комментариев.
Как CAPTCHA стала полезной
Когда «капчу» стали использовать чересчур часто, сообщество задумалось о более полезном применении технологии. В 2007 году появилась reCAPTCHA, где вместо абстрактных картинок пользователям показывали нераспознанные компьютером слова из сканов архивных выпусков газеты The New York Times.
Аудитория теперь не расшифровывала тарабарщину, а помогала оцифровывать бумажную прессу XX века. Подтвердил, что ты человек, а заодно добавил слово.
Вскоре технологию купила Google и использовала ее для оцифровки книг.
Боты тоже развивались и научились автоматически распознавать текстовую reCAPTCHA. Тогда Google выпустила принципиально новый алгоритм проверки. Теперь вместо расшифровки слов пользователям предлагали среди девяти картинок найти те, где есть котики, дорожные знаки или, например, бананы. reCAPTCHA вновь стала эффективной, а людям не пришлось ломать глаза в попытке распознать очередное неудачно отсканированное слово из книги.
В самой новой версии reCAPTCHA человеку вообще не нужно напрягаться, достаточно поставить галочку напротив отметки «Я не робот» — алгоритм анализирует движения курсора (бот пойдет по прямому кратчайшему пути) и IP-адрес. До недавних пор reCAPTCHA работала крайне эффективно и почти незаметно для пользователей.
Однажды что-то пошло не так
С первыми ошибками в работе reCAPTCHA столкнулись пользователи смартфонов. Заходишь в строку поиска Google, но вместо результата браузер показывает графическую «капчу». где надо искать объекты на матрице изображений. Причем успешно пройти тест порой было невозможно, reCAPTCHA требовала от пользователя вновь и вновь отмечать картинки.
Вслед за Google проверка пользователя всплыла и на других сайтах. Российский интернет наполнился жалобами на операторов связи, Google и даже Роскомнадзор — пользователей раздражало, что сайты при каждом посещении начали требовать подтверждения человеческой природы.
Первое время никто, включая техподдержку сайтов и провайдеров, не мог внятно ответить на вопрос, что же случилось и как пройти проверку reCAPTCHA. Когда специалисты взялись за изучение проблемы, всплыли сразу несколько причин, по которым сервис проверки на «человечность» начал неистово сбоить.
Подтверди что ты не робот
КАК ОТКЛЮЧИТЬ «Я НЕ РОБОТ» В ОКНЕ БРАУЗЕРА
Зачастую многие пользователи компьютеров сталкиваются с ситуацией, когда при попытке найти в интернете какую-либо информацию в окне браузера вместо результатов поиска наблюдают картину, предлагающую подтвердить, что они не робот. И для дальнейшего серфинга в интернете несчастным пользователям приходится набирать капчу или пристально вглядываться в размытые картинки, в общем, терять время, чтобы доказать что они не роботы, а просто люди, которым захотелось зайти в интернет. В этой статье я предлагаю разобраться, почему это происходит и как бороться с этой проблемой.
Для тех, кому привычнее смотреть и слушать, чем читать, эта статья размещена на YouTube по этому адресу.
Почему так происходит?
Для начала разберемся, почему это происходит. Во-первых, подобная проблема происходит по причине того, что некоторые поисковые системы взяли на себя ответственность контролировать «поведение» пользователей в интернете. Обычно это делается с целью предотвращения применения специализированных программ, имитирующих действия простых пользователей интернета, посещающих различные сайты.
Во-вторых, подобная ситуация может возникать, когда пользователи интернета чрезмерно часто пользуются услугами различных анонимайзеров, VPN клиентов, а также используют другие уловки, позволяющие скрыть информацию о пользователе интернета или заменить ее на другую (реальную или виртуальную).
В каких браузерах происходит?
Это может происходить в любом браузере, который использует поисковые системы «Google» или «Yandex». Причем, в этом вопросе большую «зловредность» проявляет поисковая система «Google». На Рис.1 представлен внешний вид «проявления недоверия» к пользователю от поисковой системы «Google». На Рис.2 аналогичная ситуация с поисковой системой «Yandex».
На Рис.2 (см.1 Рис.2) показан пример капчи идентификации пользователя интернета в поисковой системе «Yandex». На Рис.3 показан пример идентификации в поисковой системе «Google».
Для борьбы с подобной ситуацией различные пользователи применяют различные способы. Кто-то упорно всматривается в предлагаемый текст или картинку, набирает этот текст или кликает на «правильные» изображения, кто-то борется с этой бедой с помощью специализированных программ, а кто-то просто плюет на эту ситуацию и прекращает попытки найти ответ в интернете на интересующий его вопрос.
А ведь решение данной проблемы предельно просто (по крайней мере, в настоящий момент).
Способы обойти проблему « Я не робот» при поиске информации в интернете
Во-первых, сократите до необходимого минимума применение различных анонимайзеров, VPN клиентов и т.п.
Во-вторых, как отмечалось выше, эта проблема не зависит от применяемого браузера, а зависит только от поисковой системы. Из этого следует – просто перейдите на другую поисковую систему. На настоящий момент самыми надежными и не заангажированными в этом вопросе являются поисковые системы «DucDucGo» «Yahoo» и «Bing». Есть и другие поисковики, которые, в порыве блокировки поискового спама (ручного и машинного), пока что не пытаются издеваться над пользователями интернета, которые по какой-то причине «слишком усиленно» маскируются. Если вы не хотите менять настройки поисковых систем и браузеров на своем компьютере, когда-то выбранные вами, просто установите на панель закладок ваших любимых браузеров ссылки на вышеуказанные поисковые системы. А когда «Google» или «Yandex» потребуют от вас доказательств, что вы не робот, просто откройте любую из этих ссылок и в строке поиска вновь введите свой поисковый запрос.
Я не даю прямые ссылки на указанные поисковые системы, т.к. они (ссылки) периодически могут меняться, а уследить за изменениями довольно сложно, тем более вспомнить, в какой статье и в каком месте эта ссылка применялась. Вы всегда сможете найти эти ссылки в интернете.
В-третьих, если у вас все же есть острая необходимость применения во время поиска в интернете поисковых систем «Google» или «Yandex» (к примеру, вас заблокировали на каком-то сайте), то при поиске используйте не поисковую фразу, а конкретный URL-адрес. «Google», в отличии от «Yandex», это очень любит.
Ну, и в завершение, как я уже говорил выше и в статье «ПРИМЕНЕНИЕ АНОНИМАЙЗЕРОВ И ПОЧЕМУ НЕ СТОИТ ПОЛЬЗОВАТЬСЯ ИХ УСЛУГАМИ», не следует чрезмерно, без всякой надобности пользоваться услугами анонимайзеров, VPN клиентов и т.п. и слишком часто прятаться в интернете. Во-первых, это легко вычисляется. Во-вторых, несмотря на то, что распространители услуг «анонимного серфинга» хором кричат, что их услуги абсолютно безопасны, это далеко не так. Кто может быть уверен в том, что, устанавливая на свой компьютер VPN клиент, вы не ставите вместе с ним и какой-нибудь троян? Кто может быть уверен на 100%, что на серверах анонимайзеров не ведется журнал учета ваших действий через их сервер? И вообще, как вы проверяли надежность компаний, предоставляющих возможность анонимного серфинга?
Существуют и другие способы отключения системы идентификации «Я не робот». Я предложил один из них и, на мой взгляд, самый простой. Не знаю, как долго он будет работать, т.к. в последнее время большинство поисковых систем слишком полюбили «держать руку на пульсе» (точнее на горле) своих пользователей и заставляют их постоянно регистрироваться и выдавать им свою конфиденциальную информацию.
Почему капчи стали такими сложными
Доказывать, что ты не робот, становится всё сложнее
В какой-то момент прошлого года постоянные требования от Google доказать, что я человек, начали казаться всё более агрессивными. Всё чаще за простой и немного чересчур милой кнопочкой «Я не робот» начали появляться требования доказать это – выбрав все светофоры, переходы или витрины в сетке изображений. Вскоре светофоры начали прятаться в листве, переходы искажаться и уходить за угол, а вывески магазинов стали размытыми и перешли на корейский язык. Есть что-то весьма разочаровывающее в неудачных попытках найти на изображении пожарный гидрант.
Эти тесты называются CAPTCHA – акроним от «полностью автоматического публичного теста Тьюринга, предназначенного для различения людей и компьютеров», и когда-то они уже доходили до подобной степени неразборчивости. В начале 2000-х простых изображений с текстом было достаточно, чтобы остановить большинство спам-ботов. Прошло десять лет, и после того, как компания Google купила программу у исследователей из Университета Карнеги-Меллона и использовала её для оцифровки в проекте Google Books, тексты приходилось всё сильнее искажать и скрывать, чтобы обгонять улучшающиеся программы оптического распознавания символов – те самые программы, которые помогали улучшать те самые люди, кому приходилось разгадывать все эти капчи.
Поскольку CAPTCHA – элегантный инструмент для тренировок ИИ, то любой придуманный тест может продержаться лишь некоторое время, что признают и его изобретатели. Со всеми этими исследователями, мошенниками, и простыми людьми, решающими миллиарды задачек на грани возможного для ИИ, в какой-то момент машины просто обязаны были нас обогнать. В 2014-м Google стравила между собой свой лучший алгоритм по разгадыванию самых искажённых текстов и людей: компьютер правильно распознал текст в 99,8% случаев, а люди всего в 33%.
После этого Google перешла на NoCaptcha ReCaptcha, наблюдающую за поведением людей и собирающую их данные, что позволяет некоторым из них пройти дальше просто по клику на кнопке «Я не робот», а другим выдаёт задачи на поиск изображений, которые мы сегодня и наблюдаем. Но машины снова настигают нас. Все эти навесы, которые могут быть или не быть витринами магазинов – это заключительная стадия гонки вооружений людей и машин.
Язон Полакис, профессор информатики в Университете Иллинойса в Чикаго лично отвечает за недавнее усложнение капчи. В 2016-м он опубликовал работу, в которой использовал готовые программы распознавания изображений, включая собственный поиск по изображением от Google, чтобы решать капчи с точностью в 70%. Другие исследователи справлялись с распознаванием аудио капчи от Google при помощи программ по распознаванию речи от самой же компании.
Машинное обучение уже не хуже людей справляется с распознаванием простых текстов, изображений и голоса, говорит Полакис. Алгоритмы, возможно, даже делают это уже лучше: «Мы дошли до момента, когда усложнение задач для софта приводит к тому, что задачи становятся чрезмерно сложными для людей. Нам нужна альтернатива, но чёткого плана пока нет».
Литература по капчам переполнена фальстартами и странными попытками найти что-то кроме текста и изображений, с чем хорошо справляются все люди и плохо справляются машины. Исследователи пробовали предлагать пользователям сортировать изображения людей по выражению лиц, полу и этнической принадлежности (можете представить, как это прошло). Были предложения организовать капчи с викторинами, капчи на основе колыбельных, распространённых в тех местах, где, как предполагается, вырос пользователь. Такие капчи с культурной привязкой нацелены не только на роботов, но и на людей из других стран, решающих капчи за копейки. Люди пытались загнать алгоритмы распознавания изображений в тупик, предлагая пользователю опознать, например, свинью, но при этом рисованную и в солнечных очках. Исследователи изучали такие варианты, как предложить пользователям распознать объекты в мешанине калейдоскопа. В одном из интересных вариантов в 2010-м исследователи предложили использовать капчу для сортировки древних петроглифов – компьютеры плохо справляются с распознаванием скетчей или изображений оленей на стенах пещер.
Недавно были попытки разработать игровые капчи, где пользователю нужно вращать объекты на определённые углы или передвигать кусочки головоломки, причём инструкции по решению капчи давались не в виде текста, а в виде символов, или же подразумевались по контексту игрового поля. Надежда на то, что люди поймут логику загадки, а компьютеры без чётких инструкций споткнутся. Другие исследователи пытались использовать факт наличия у людей тел, и применяли камеры устройств или дополненную реальность для интерактивного подтверждения наличия человека.
Со многими из этих тестов проблема не в том, что роботы слишком умные, а в том, что люди плохо с ними справляются. И дело не в том, что люди тупые; они просто очень сильно различаются по языку, культуре и опыту. Избавившись от всего этого, чтобы сделать тест, который может пройти любой человек без тренировки и долгих размышлений, мы остаёмся с такими грубыми задачами, как распознавание изображений – а это именно то, с чем хорошо справится специально заточенный под это ИИ.
«Тесты ограничены возможностями человека, — говорит Полакис. – Дело не только в физических возможностях – нужно найти что-то межкультурное, межъязыковое. Нужна задача, которая хорошо работает с человеком из Греции, с человеком из Чикаго, с человеком из Южной Африки, Ирана и Австралии одновременно. И она не должна зависеть от культурных нюансов и различий. Нужна задача, с которой хорошо справляется средний человек, она не должно быть ограничено определённой подгруппой людей, и она должна быть трудной для компьютера. Всё это сильно ограничивает выбор вариантов. А ещё это должно быть что-то, с чем люди справляются быстро, и что не сильно раздражает».
Попытки решения этих загадок с размытыми картинками быстро переводят человека на философские рельсы: есть ли какое-то универсальное человеческое качество, которое можно продемонстрировать машине, и которое машина не может имитировать? Что значит – быть человеком?
Может, наша человечность измеряется не тем, как мы выполняем задачи, а тем, как мы ведём себя, продвигаясь сквозь мир – или, в данном случае, сквозь интернет. Игровые капчи, видеокапчи, любые капчи, которые вы сможете придумать, в итоге будут взломаны, говорит Шуман Госмахумдер [Shuman Ghosemajumder], занимавшийся в Google борьбой с автоматизацией кликов, а потом ставший технологическим директором компании по распознаванию роботов Shape Security. Он склоняется в сторону «постоянной авторизации» вместо отдельных тестов – к наблюдению за поведением пользователя и поиску признаков автоматизации. «Реальный человек не очень хорошо контролирует моторику, и не может двигать мышь одинаковым образом много раз во время нескольких взаимодействий, даже если будет пытаться сделать это», — говорит Госмахумдер. Робот будет взаимодействовать со страницей, не двигая мышью, или двигая её очень точно, а в действиях человека будет наблюдаться «энтропия», которую сложно подделать, говорит Госмахумдер.
Собственная команда Google, занимающаяся капчей, работает в сходном направлении. Последняя версия reCaptcha v3, выход которой был объявлен в конце прошлого года, использует «адаптивный анализ рисков» для оценки трафика по подозрительности; владельцы сайтов могут предлагать подозрительным пользователям задачи вроде ввода пароля или двухфакторной авторизации. В Google не сообщают, какие факторы учитываются при оценках, кроме того, что компания оценивает, как выглядит на сайте «хороший трафик», и использует эту информацию для фильтрации «плохого трафика», согласно Сай Кормаи [Cy Khormaee], менеджеру продукта из команды CAPTCHA. Исследователи в области безопасности говорят, что это, вероятно, смесь куков, атрибутов браузера, закономерностей трафика и других факторов. Один недостаток новой модели распознавания роботов состоит в том, что навигация в вебе при попытках минимизации наблюдений за пользователем может стать немного раздражающей, поскольку такие вещи, как VPN и расширения, затрудняющие отслеживание пользователя, могут отметить вас, как подозрительного.
Аарон Маленфант [Aaron Malenfant], ведущий инженер команды CAPTCHA в Google, говорит, что сдвиг в сторону от тестов Тьюринга должен помочь обойти соревнование, которое люди всё время проигрывают. «Чем больше мы будем вкладываться в машинное обучение, тем сложнее эти задачи будут становиться для людей, и, в частности, поэтому мы запустили CAPTCHA V3 – чтобы опередить эту кривую». Маленфант говорит, что через 5-10 лет задачи в капче вообще не будут иметь смысла. Большая часть веба будет зависеть от постоянного скрытого теста Тьюринга, работающего на фоне.
В своей книге «Самый человечный человек» Брайан Кристиан [Brian Christian] принимает участие в тесте Тьюринга в качестве подсадной утки и понимает, что очень сложно доказать свою человечность в беседах. С другой стороны разработчики ботов обнаружили, что эти тесты легко пройти, не притворяясь красноречивым или интеллектуальным собеседником, а отвечая на вопросы при помощи нелогичных шуток, делая опечатки, или, как в случае бота, выигравшего соревнование Тьюринга в 2014-м, заявляя, что ты – 13-летний украинский мальчик, плохо говорящий по-английски. Ведь человеку свойственно ошибаться. Возможно, что такое будущее ждёт и капчу, самый распространённый тест Тьюринга в мире – новая гонка вооружений будет создавать не роботов, превосходящих людей в сортировке изображений и разборе текста, а роботов, делающих ошибки, промахивающихся по кнопкам, отвлекающимся и переключающим вкладки. «Думаю, народ начинает понимать, что есть области применения для симуляции среднего пользователя-человека… или тупых людей», — говорит Госмахумдер.
Капчи могут сохраниться и в этом мире. В 2017-м Amazon зарегистрировала патент на схему, в которой используются оптические иллюзии и логические задачки, с которыми тяжело справляться людям. Этот тест называется «тест Тьюринга через ошибку», и единственный способ пройти его – дать неверный ответ.
«Я не робот»: история Яндекса о том, как победить ботов, а не людей
Никто не любит капчу. Угадай слово по плохой картинке, собери пазл, отличи светофор от гидранта, сложи два числа и так далее. Формы бывают разные, но суть всегда одна: мы тратим своё время и нервы.
Чуть больше года назад моя команда взялась за модернизацию старой капчи Яндекса. Обычно в таких задачах стремятся повысить качество и полноту отсева ботов, оставив человеку шанс прорваться через капчу. Но мы зашли с другой стороны: решили сделать капчу более дружелюбной к людям, не ухудшив при этом защиту от ботов. Казалось бы, наивный подход. Но у нас получилось.
Сегодня я расскажу об этом подробнее. Вы узнаете, как мы отказались от распознавания текста и перешли к его генерации. Покажу примеры дружелюбной капчи. Расскажу о необычном опыте применения капчи в образовании. А ещё покажу текущий вариант капчи без капчи и немного поразмышляю о будущем.
Несколько слов о том, зачем нужна капча. Уверен, это и так не секрет, но историю всё же стоит начать с основ, чтобы быть на одной волне.
Капча — это инструмент, который помогает сервису понять, обратился к нему человек или робот. Это полезно, потому что роботы создают нагрузку или даже занимаются откровенным вредительством. При этом нужно показывать капчу не всем, а только тем, чьи запросы похожи на автоматические. Для этого надо проанализировать запрос. Анализ — это уже давно не просто подсчёт числа заходов с конкретного IP. Факторов для анализа намного больше, чем один. С другой стороны — сервис с нагрузкой в сотни тысяч RPS и с жёстким требованием к скорости ответа пользователю. Если снизить скорость ответа, то пострадают пользователи. Если снизить полноту выявления ботов, то в итоге опять же пострадают пользователи. Значит, нужно искать баланс между этими крайностями. И получается, всегда будут люди, которым покажут капчу.
Первые шаги
Год назад наши пользователи видели примерно такие задания:
Два слова. Одно мы знаем. Другое хотим узнать. Вряд ли я открою большой секрет, если расскажу, что капчу часто применяют для обучения компьютерного зрения. Раньше так было и у нас.
В целом ничего жуткого, да? Но могу и жути нагнать. Вот примеры более сложных (но крайне редких) вариантов:
Мы, конечно, такое вычищали. Использовали для этого как классификаторы неоднозначно читаемых картинок, так и данные о поведении пользователей (если человек даже не пытается ввести текст, то это плохой сигнал). Но и после таких изменений людям было очень сложно. Можно сказать, что старая капча отлично экономила ресурсы: её не могли пройти ни боты, ни люди. Только 35% реальных пользователей справлялись с первой попытки. Очень страшное число. Нужно было что-то менять.
Начали с анализа наиболее частых ошибок. В топе оказались знаки препинания, верхний и нижний регистр букв, лишние пробелы. Посчитали, как у ботов с этими проблемами. Оказалось, что можно безболезненно отказаться от их учёта при проверке результата. Эти элементарные, быстрые решения принесли нам с ходу +15%. Но дальше простые идеи закончились. Нужно было подойти к задачке более глобально.
Свои картинки с текстом
Поговорим о картинках. Так как их мы не генерировали, а вырезали из готовых, иногда там встречались очень необычные тексты. Их вы уже видели выше: это и перевёрнутые штрихкоды, и логарифмы. Их можно фильтровать с переменным успехом, но гибкости в работе с ними нет. Нельзя оперативно управлять сложностью, контролировать допустимый словарный запас, выбирать язык для разных стран. Если хочешь полностью контролировать качество капчи, то выход только один — генерировать картинки самостоятельно. Так мы и поступили.
Мы хотели создать капчу, которая будет существенно легче читаться людьми, но не ботами. На входе у нас есть какой-то текст и какой-то фон. Осталось понять, что нужно с ними сделать, чтобы добиться желаемого.
Наиболее эффектно, пожалуй, выглядит способ точечно искажать исходную картинку так, чтобы машина видела в ней совершенно не то, что видит человек.
Лёгкий шум превратил горы в собаку и рыбку в краба. Источник: https://arxiv.org/pdf/1710.06081v2.pdf
Но такой подход крайне чувствителен к изменениям алгоритмов распознавания на стороне роботов. Пришлось бы мониторить их особенно тщательно и слишком часто адаптироваться. Поэтому мы подошли более консервативно.
Задачу распознавания текста нейросетями сейчас решают хорошо, причём уже далеко не только лидеры индустрии. Но трудные задачки по-прежнему встречаются. Наиболее сложные датасеты с распознаванием слов на сегодняшний день представляют собой сильно искривлённые тексты (irregular text recognition).
Это то, с чем человек справляется относительно просто. Но не робот. Этот подход мы применили и у себя. Пример такой капчи:
Выглядит проще, чем раньше? Наши пользователи тоже так считают: эту капчу легко преодолевают уже 85% пользователей. А вот ребятам, которые учатся обходить нашу капчу, работы прибавилось.
Скриншот с одного из «секретных» форумов об автоматизации
Конечно, со временем к ней адаптировались, но масштабы проблемы в итоге не больше, чем у старой капчи. При этом людям стало существенно проще.
Полезная и добрая капча
Успех с генерацией собственных картинок воодушевил нас. Мы осознали, что капче не обязательно быть исключительным злом в глазах пользователей. Она может быть такой, какой мы захотим её сделать. Например, полезной для людей.
Каждый октябрь в России отмечают День учителя. Мы решили отпраздновать его по-своему и с пользой. Собрали данные о том, в каких словах пользователи чаще всего делают ошибки. (Яндекс по понятным причинам неплохо в этом разбирается.) На базе этого словаря сгенерировали капчу, отметив те буквы, в которых люди ошибаются. Выкатили на огромную аудиторию. Ботам это ничем не помогло, а вот людям (хочется верить!) пользу принесло.
Другой пример работы с капчей, чуть ближе к концу 2020 года. Хотелось немного поднять пользователям настроение. Придумали использовать для генерации капчи не какие попало слова и фразы, а только те, что несут положительный эмоциональный заряд. Проще говоря, такие слова, которые как минимум не портят настроение ещё больше, а в идеале улучшают его.
Собрали данные с помощью толокеров. Сгенерировали. Получили капчу, которая содержала фразы «Приятных эмоций», «Вам всё по плечу», «Продуктивного дня» и подобные.
В общем, идей для работы с капчей много. Но нельзя забывать самую главную: лучшая капча — это та, которой нет.
Капча без капчи
Вернёмся в самое начало нашей истории. Там я рассказывал о том, что капчу предлагают только тем пользователям, чьи запросы в результате быстрого анализа показались нам подозрительными. Быстрый анализ отрабатывает примерно за одну (!) миллисекунду. Делать это дольше без вреда для высоконагруженного сервиса и миллионов пользователей нельзя. Это значит, что нужно использовать быстрые алгоритмы, а они не всегда самые точные. Из-за этого люди видят капчу. Как можно обойти это узкое место? Использовать промежуточный шаг!
Если быстрый анализ вынес вердикт о подозрительности запроса, то мы можем перенаправить его на страницу с капчей. Но саму капчу пока что не показывать. Потому что в этот момент у нас появляется время на второй, более глубокий и сложный анализ. Мы можем потратить намного больше, чем одна миллисекунда, а значит, спасти существенное количество наших пользователей от необходимости преодолевать пусть и не страшную, но всё же капчу.
Теперь это работает так. Если человеку не повезло попасть на страницу с капчей, то вместо капчи он видит предложение поставить галочку и подтвердить, что он не робот.
Пока пользователь ставит галочку, мы проводим дополнительный анализ с использованием более сложной ML-модели. Если всё хорошо, то возвращаем на сервис. Если «подозрительность» сохраняется, то показываем текстовую капчу.
И ещё кое-что важное. Переход от бинарных вердиктов (бот — не бот) на первом этапе к вероятностным («робот на N%») на втором позволяет нам управлять сложностью капчи! Если на втором этапе мы по-прежнему считаем запрос подозрительным, но степень уверенности в этом не такая высокая, то показываем простейшую капчу. А вот если мы уверены, что перед нами робот, то можем сложность и приподнять. Простое, но эффективное решение.
Несколько слов о значимости этого решения для людей. Выше мы радовались тому, что 85% (а не 35%, как было раньше) пользователей справляются с новой текстовой капчей с первой попытки. Но с галочкой «Я не робот» ситуация изменилась радикально: теперь более половины пользователей возвращаются в сервис вообще без необходимости разгадывать капчу! Вот такая вот капча без капчи.
За последний год мы прошли длинный путь, но идей на будущее от этого меньше не стало. Мы уже работаем над тем, чтобы получать более точные вердикты в реальном времени и без перенаправления на промежуточные страницы. И уже есть первые успехи. Один частный пример: теперь в Safari в режиме Инкогнито встретиться даже с галочкой «Я не робот» вероятность примерно в десять раз ниже, чем раньше. Кроме того, хотим пробовать новые, более добрые форматы капчи для тех случаев, когда без неё никак.
Формы капчи могут быть разные, но главное в том, чтобы относиться к людям по-человечески и уважать их время.