Иногда сканирую старые книжки под себя и хочу сделать из сканов их же fb2 варианты, но времени на вычитку и редактуру нет, а нейросети очень неплохо справляются с небольшими блоками текста. Так вот, хочу найти (или создать) готовый скрипт\программу, короче метод, при котором можно дать нейросети необработанный, голый текст сразу из файнридера, запакованный в фб2 или в докс как вариант, и чтоб в результате нейросеть (желательно, локально) все обработала, сделала вычитку, исправила все ошибки и лажу и выдала в результате готовую книгу с заголовками, с оглавлением, с форматированием, в общем чтоб все по феншую и заебись. Есть такие варианты? (я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)
>>1034613 (OP) Я этим и занимаюсь, только в epub. Через deepseek. Промт "Распознай текст с изображения. Убери нумерацию страниц. Результат выдай на русском языке."
Затем этот текст:
"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст."
Потом
"Подготовь этот текст к интеграции в epub-книгу, добавив к ней html-теги. Не используй заголовки. Исходный текст не сокращай."
>>1034704 >"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст." И сразу фейл мгновенный, если книга с цитатами и формулами, а также инфографикой.
Я попробовал дать паре нейронок файл, и попросил сделать ёфикацию всего текста (худ.лит. на 300 килобайт, в формате .txt).
Интересовало именно выполнение задачи по обработке текста за один раз на относительно немалый объём.
Потом сел и стал читать-проверять от начала до конца, попутно исправляя промахи нейронки. Так вот - заебался исправлять. Работа сделана через пень-колоду, ошибок слишком дохуя. Результат их работы нужно постоянно проверять и исправлять, а это ненамного быстрее, чем самому делать.
> (я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло) Аналогично. "Что-то, как-то, работающее кое-как и недолго".