Перевод и распознавание текста

Администратор
Андрей Столяров
Медаль
Сообщений: 214
Санкт-Петербург
13 дней назад
Для перевода рекомендую использовать google-переводчик. Теперь в него можно загружать документы целиком.
Но есть один совет: сначала создать документ в Word, исправив в нём все переносы и ошибки.

Распознавание отлично выполняет FineReader. На сайте http://finereaderonline.com можно бесплатно при регистрации распознать 10 страниц. Распознаёт даже отфотографированные старые машинописные методички почти без ошибок!
Кроме графических документов распознавать можно и текстовые pdf-документы, это часто более эффективно, чем конвертация их в word, по причине того, что при конвертации формулы и некоторые рисунки превращаются беспорядочные наборы символов.

При работе в программе FineReader:
1) Проверить и исправить разбиение текста на блоки. Блоки формул переделать в картинки.
2) Проверить и исправить порядок блоков (Главное меню / Области / Перенумеровать области), иначе они в распознанном тексте будут расположены в неправильном порядке.
3) После распознавания использовать сохранение как простого текста без форматирования, но с картинками.

В Word:
1) Удалить мягкие переносы (в диалоге "Замена" это условный символ "^-").
2) В режиме отображения непечатаемых символов проверить все знаки абзаца и удалить лишние, которые разрывают предложения.
3) Проверить картинки и перенести их, если они разрывают предложения.
4) Проверить и исправить все подчёркнутые орфографические ошибки (F7).
5) Проверить и удалить лишние знаки "тире" в словах (образуются при распознавании знаков переноса)


Для подготовки изображений помимо Фотошопа, как ни странно, могу рекомендовать бесплатный Gimp. Программу нужно чуть-чуть освоить, но, если привыкнуть, он предоставляет мощный набор инструментов на все случаи жизни. Даже недавно делал GIF-анимацию.
Редактировалось: 6 раз (Последний: 31 марта 2016 в 08:00)
Перейти на форум:
Быстрый ответ
Чтобы писать на форуме, зарегистрируйтесь или авторизуйтесь.