Главная Юзердоски Каталог Трекер NSFW Настройки

Книги

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 8 2 6
Вычитка книг при помощи нейросетей - как сделать? Аноним # OP 06/12/25 Суб 18:19:02 1034613 1
изображение.png 1239Кб, 1200x628
1200x628
Иногда сканирую старые книжки под себя и хочу сделать из сканов их же fb2 варианты, но времени на вычитку и редактуру нет, а нейросети очень неплохо справляются с небольшими блоками текста.
Так вот, хочу найти (или создать) готовый скрипт\программу, короче метод, при котором можно дать нейросети необработанный, голый текст сразу из файнридера, запакованный в фб2 или в докс как вариант, и чтоб в результате нейросеть (желательно, локально) все обработала, сделала вычитку, исправила все ошибки и лажу и выдала в результате готовую книгу с заголовками, с оглавлением, с форматированием, в общем чтоб все по феншую и заебись.
Есть такие варианты?
(я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)
Аноним 06/12/25 Суб 19:05:05 1034616 2
Поинтересуйся в /ai
Аноним 06/12/25 Суб 19:45:19 1034622 3
>>1034616
уже поинтересовался - пока не ответили
Аноним 07/12/25 Вск 19:46:49 1034704 4
>>1034613 (OP)
Я этим и занимаюсь, только в epub. Через deepseek. Промт
"Распознай текст с изображения. Убери нумерацию страниц. Результат выдай на русском языке."

Затем этот текст:

"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст."

Потом

"Подготовь этот текст к интеграции в epub-книгу, добавив к ней html-теги. Не используй заголовки. Исходный текст не сокращай."
Аноним 08/12/25 Пнд 06:27:33 1034752 5
>>1034704
>"Проверь текст на наличие неуместных иностранных символов и иероглифов - их не должно быть. Только русский перевод или научные термины. Выдай исправленный текст."
И сразу фейл мгновенный, если книга с цитатами и формулами, а также инфографикой.
Аноним 08/12/25 Пнд 06:44:47 1034754 6
image.png 155Кб, 1624x874
1624x874
>>1034704
Только сейчас узнал что FB2 по сути российский и нигде не используемый кроме как здесь формат.
Аноним 08/12/25 Пнд 18:49:39 1034818 7
>>1034752
Я скинул основные промты, которыми обрабатывал тысячи страниц. Таблицы и формулы делаю отдельно. Изображения рисую в svg-формате.
Аноним 09/12/25 Втр 00:38:01 1034857 8
>>1034613 (OP)
> Есть такие варианты?

Я попробовал дать паре нейронок файл, и попросил сделать ёфикацию всего текста (худ.лит. на 300 килобайт, в формате .txt).

Интересовало именно выполнение задачи по обработке текста за один раз на относительно немалый объём.

Потом сел и стал читать-проверять от начала до конца, попутно исправляя промахи нейронки. Так вот - заебался исправлять. Работа сделана через пень-колоду, ошибок слишком дохуя.
Результат их работы нужно постоянно проверять и исправлять, а это ненамного быстрее, чем самому делать.

> (я уже попробовал через те же нейросети писать скрипты для питона, но пока ниче толкового не вышло)
Аналогично. "Что-то, как-то, работающее кое-как и недолго".
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов