[Ответить в тред] Ответить в тред

16/08/16 - Запущен Двач Трекер
01/08/16 - Вернули возможность создавать юзердоски
09/07/16 - Новое API для капчи - внимание разработчикам приложений



Новые доски: /obr/ - Offline Battle Rap • /hv/ - Халява в интернете • /2d/ - Аниме/Беседка • /wwe/ - WorldWide Wrestling Universe • /ch/ - Чатики и конфочки • Создай свою

[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 11 | 1 | 6
Назад Вниз Каталог Обновить

Привет. Возможно ли написание программы, хорошо Аноним 31/08/16 Срд 21:24:22  832320  
14726678625300.png (8Кб, 316x200)
14726678625301.png (8Кб, 328x207)
14726678625302.png (9Кб, 323x202)
14726678625303.png (10Кб, 315x212)
Привет. Возможно ли написание программы, хорошо отгадывающей капчу типа пикрелейтид? Я профан в этой теме, но слышал, что такое делают.
Если это возможно (80% правильно отгаданной такой капчи, например), то сколько примерно будет стоить само написание программы?

Я полный профан, не обессудьте не обоссыте.
Аноним 31/08/16 Срд 21:41:54  832344
>>832320 (OP)
В теории, можно создать нейросеть и натренировать ее, но для этого нужна большая база картинок с уже разгаданной капчей.
Аноним 31/08/16 Срд 21:45:06  832352
>>832344
И сколько примерно тысяч таких картинок нужно для 80% точности?
Аноним 31/08/16 Срд 21:46:32  832355
>>832352
Не ебу, так как я лишь диванный теоретик, но много, да.
Аноним 31/08/16 Срд 22:06:22  832377
>>832352
Сотни миллионов
Аноним 31/08/16 Срд 23:52:40  832486
>>832320 (OP)
Это целые слова, а не обычная абракадабра, значит можно сверяться со словарём. Думаю 80% достичь реально, если придумать грамотный препроцессинг, который будет правильно убирать фон и заполнять контурные буквы. Но непросто.
А почему 80%? Зачем так много?
Аноним 01/09/16 Чтв 00:20:03  832496
>>832344
Это не так делается же. У тебя не хватит мощностей на работу по целым словам.

Для таких сравнительно простеньких, как на оппике, капч (скажем, у гугла пять лет назад были капчи сложнее) все довольно просто. Обесцвечивание, простейшая бинаризация по порогу для выделения текста, градиентное выделение границ, какой-нибудь простенький алгоритм экстраполяции их до замкнутых, заливка. Получаем несколько компонент связности, слишком большие в сравнении с другими - режем в самых тонких местах. Остаются отдельные буквы. Нормируем их растягиванием и поворотом, чтобы моменты (среднее отклонение от центра масс) стали образцовыми, получается нечто похожее на стандартные буквы. И вот уже эти буквы пихаем в какой-нибудь классификатор (например, в нейросеть), который предварительно обучен по выборке из разных шрифтов и прочей хуйни. Когда будут готовые распределения вероятностей букв, уже можно сравнивать со словарями, как сказал >>832486 - кун, но не раньше.
Аноним 01/09/16 Чтв 00:37:44  832502
>>832496
И сколько вся эта работа будет примерно стоить?
Нейросеть уже не потребует сотней миллионов примеров?
Аноним 01/09/16 Чтв 00:40:22  832505
>>832496
Алсо, для моей цели тысяч 15 я осилю забить в базу нейросети. Максимум, 20 тысяч. Но я же не ёбнутый в край, чтобы ещё больше.
Аноним 01/09/16 Чтв 01:39:31  832518
>>832505
Проще написать софтину использующую api от капчамакакинга-сервисов типа рукапча. 10к разгаданных каптч обойдутся в 180 рублей, к примеру.
Аноним 01/09/16 Чтв 06:52:26  832544
>>832502
Не потребует, уже есть готовые. Если любишь скрипты, можешь банально прикрутить FineReader, тогда вообще ничего не надо будет выдумывать.
Аноним 01/09/16 Чтв 06:53:10  832545
>>832518
Двачую, кстати. Китайцы будут дешевле AI еще лет десять минимум.

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 11 | 1 | 6
Назад Вверх Каталог Обновить

Топ тредов
Избранное