Привет. Возможно ли написание программы, хорошо отгадывающей капчу типа пикрелейтид? Я профан в этой теме, но слышал, что такое делают.Если это возможно (80% правильно отгаданной такой капчи, например), то сколько примерно будет стоить само написание программы?Я полный профан, не обессудьте не обоссыте.
>>832320 (OP)В теории, можно создать нейросеть и натренировать ее, но для этого нужна большая база картинок с уже разгаданной капчей.
>>832344И сколько примерно тысяч таких картинок нужно для 80% точности?
>>832352Не ебу, так как я лишь диванный теоретик, но много, да.
>>832352Сотни миллионов
>>832320 (OP)Это целые слова, а не обычная абракадабра, значит можно сверяться со словарём. Думаю 80% достичь реально, если придумать грамотный препроцессинг, который будет правильно убирать фон и заполнять контурные буквы. Но непросто.А почему 80%? Зачем так много?
>>832344Это не так делается же. У тебя не хватит мощностей на работу по целым словам.Для таких сравнительно простеньких, как на оппике, капч (скажем, у гугла пять лет назад были капчи сложнее) все довольно просто. Обесцвечивание, простейшая бинаризация по порогу для выделения текста, градиентное выделение границ, какой-нибудь простенький алгоритм экстраполяции их до замкнутых, заливка. Получаем несколько компонент связности, слишком большие в сравнении с другими - режем в самых тонких местах. Остаются отдельные буквы. Нормируем их растягиванием и поворотом, чтобы моменты (среднее отклонение от центра масс) стали образцовыми, получается нечто похожее на стандартные буквы. И вот уже эти буквы пихаем в какой-нибудь классификатор (например, в нейросеть), который предварительно обучен по выборке из разных шрифтов и прочей хуйни. Когда будут готовые распределения вероятностей букв, уже можно сравнивать со словарями, как сказал >>832486 - кун, но не раньше.
>>832496И сколько вся эта работа будет примерно стоить? Нейросеть уже не потребует сотней миллионов примеров?
>>832496Алсо, для моей цели тысяч 15 я осилю забить в базу нейросети. Максимум, 20 тысяч. Но я же не ёбнутый в край, чтобы ещё больше.
>>832505Проще написать софтину использующую api от капчамакакинга-сервисов типа рукапча. 10к разгаданных каптч обойдутся в 180 рублей, к примеру.
>>832502Не потребует, уже есть готовые. Если любишь скрипты, можешь банально прикрутить FineReader, тогда вообще ничего не надо будет выдумывать.
>>832518Двачую, кстати. Китайцы будут дешевле AI еще лет десять минимум.