Распознаем текст онлайн с картинок, отсканированных документов бесплатно и без регистрации
Приветствую вас, дорогие читатели блога. Сегодня я хочу рассказать вам о некоторых сервисах, которые давно у меня лежат в закладках. Речь пойдет о сервисах распознавания текста онлайн.
Наверное, у каждого был случай, когда вы хотели переписать какой-то текст с картинки или PDF файла. Это могли быть какие-то документы или просто красивая цитата. У меня таких случаев было немало и меня всегда выручали сервисы распознавания текста. Конечно, существуют и программы для этой цели, но я предпочитаю такие простые задачи делать онлайн.
Ниже вы можете увидеть перечень сервисов, благодаря которым распознать текст с изображения проще простого. Все сервисы абсолютно бесплатны и не требуют регистрации.
Принцип сервисов весьма прост. Вы загружаете изображение, содержащее текст, сервис его обрабатывает и выдает вам готовый текст, избавляя вас от его переписывания. Качество распознавания текста с изображения напрямую зависит от качества самого изображения.
Где можно распознать текст с PDF файла, картинки или фотографии бесплатно
Итак, вот список сервисов:
www.newocr.com – позволяет распознать текст бесплатно с изображений таких форматов как: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Сервис поддерживает множество языков. После распознания текста с картинки, его можно скопировать и вставить в свой документ.
www.onlineocr.net — аналогичный предыдущему сервис, с тем лишь отличием, что здесь распознанный текст можно скачать в форматах Microsoft Word (docx), Microsoft Exel (xlsx), Text Plain (txt).
www.free-ocr.com – сервис, поддерживающий форматы jpg, png, bmp, pdf, jpeg, tiff, tif и gif. Языков распознавания чуть меньше чем в предыдущих сервисах, но тоже немало. Скачать распознанный тест можно в txt формате.
www.i2ocr.com – сервис, поддерживающий более 60 языков. Кроме основной функции распознавания текста с изображений, здесь есть такие инструменты как:
- Конвертация web-страницы в PDF;
- Преобразование web-страницы в изображение (скриншот);
- Генератор кнопок CSS3;
- Международные клавиатуры;
- Преобразователь формата изображений;
Качество извлечения текста с изображений
Особой разницы в качестве распознавания текста на изображениях между сервисами я не заметил, поэтому в качестве примера покажу лишь первый сервис.
Для примера я взял несколько изображений разного размера и качества изображенного текста.
Изображение 1 (790 X 588 px)
Изображение 2 (793 X 1024 px)
Изображение 3 (600 X 350 px)
И вот результат самого текста, который сервис распознал на картинке.
Результат 1 изображения:
Шел 25 год без
собственной яхты и домика
на берегу океана, мысль о
продаже почки перестает
казаться безумной.
В первом изображении текст распознан идеально и вообще без ошибок.
Результат 2 изображения:
Меню В новогоднюю ночь
ЯТриветственный коктейль
(Шампанское советское) 150 гр.
Соленая квашенные, домашние. 60/1 гр.
Грибочки из погребка.
Яссорти аз маранованньск грибов. 64,5 гр.
ч Мясное Яссорта (ростбиф, язык буякенана) 85 гр.
Сельдь с картофелем и луком красным. 100 гр.
Лосось камчатский с травами дикими 58,5 гр.
Селедочка под шубкой. 200 гр.
Холодец, с мясом. 182 гр.
Оливье мясной 150 гр.
Салат с куриной грудкой а грибочкама 150 гр.
фруктовая ваза
(виноград, груша, бананы, яблоко, апельсин, кави) 375 гр.
Сигбная корзина 85 гр.
Кулебяка с лососем и судаком или 212 гр.
Товядана со сметаной и сыром картофельным
гратаном а соусом красное вино 247 гр.
Запеченые груши с красным вином,
мороженным и грецкими орехами 142 гр.
Напитки
Шампанское (Российское полсл. 750 гр.
7 (Водка Лунтика 500 гр.
(Вано Красное Ундурага сух, 750 гр.
Фано *Белое {Ундурага сук. 750 гр.
$ода с газом 600 гр.
Фода без газа 600 гр. ., №3
3 \ . , , ‘ , :Морс (промышленный) 1000 гр.»?`
Сок/‘!пельсан ( 2л. ) 2000 гр.
Здесь видно присутствие ошибок. Это связано с особенностю шрифта и контрастом текста на основном фоне.
Результат 3 изображения:
Чтобы питательные маски отдали вашей коже
есь свой полезный арсенал, важно
7 олнять их правильно. Вот моменты,
ые нужно учитывать при
Ь; _ ьэоваиии питательных масок для лица.
Йтательные маски нельзя х
ранить, они
“тотовятся непосредственно перед
Чоцедурой
е_ перед применением питательной маски
[Гдлицо необходимо очистить скрабом и слегка
вает-рить
лице питательная маска держится 20
минуъ‘после чего смывается теплой водой
в темение часа после использования
питательной маски на улицу желательно не
ьд‘выходить
стота применения питательных масок для
и лица — 2-3 в неделю
спользуйте принцип — две недели делаете
В третьем примере левая часть столбца имееет плохую контрастность, поэтому некоторы слова вообще не распознаны.
На основе этих трех примеров, можно сделать простой вывод – чем лучше и отчетливее виден текст на изображении, тем более качественное будет распознавание текста. Многое так же зависит от шрифта текста. Если шрифт простой, то его сервис прочтет без труда, ну а чем сложнее шрифт, тем больше будет ошибок при распознавании текста.
Спасибо искреннее… Реально не знал об этих сервисах, так сказать в диковинку… новинка для меня чайника…
Пожалуйста
Андрей, вот это да! Я даже и не знал о таких программках! Вот спасибо большое, как классно и быстро можно текст с картинки забрать! А то как то пару раз приходилось ручками переписывать =)))))))
Руками переписывать это конечно жесть, особенно если это несколько страниц отсканированной книги ))
Еще бы сам сканировал и ошибки проверял за себя))
Тогда бы вообще цены не было этим сервисам 🙂
Отличные сервисы, на заметке должны быть у любого человека кто работает с перепечаткой документов. Отличное решение, что бы полностью не печатать, а лишь исправить пару ошибок)
Было бы правильным исправить ошибку в заголовке статьи…
Спасибо за замечание, я как-то не заметил. Поправил.
Как оказывается можно просто жить, если уметь все то о чем Вы пишите 🙂 Спасибо Вам за полезные статьи.
Отвратительные сервисы! Распознавать совершенно не умеют! Какая-то абракадабра получается на выходе. Оптимальный вариант– платная прога Fine Reader. Аналогов ей как не было, так и нет.
Спасибо! Пользовалась раньше бесплатным сервисом, но компьютер полетел, потеряла ссылку, а здесь у вас целое царство ! Спасибо за ваш труд!
Отлично знаю программу от ABBY для распознавания текста, доводилось пользоваться и хоть некоторые огрехи всё же были, в целом, очень ценная помощь. Сейчас появилась необходимость распознать текст с фото (фотография страницы книги, чёткая), платной программы у меня нет, а потому увидев аж несколько ссылок на бесплатные сайты я пришла в восторг, но обольщаться не стоило. Все вышеуказанные сервисы дружно выдали мне вместо русского текста нечто следующее:»MoHro.no-3a6ailmainbcxam CHCT e-rs4 a.». Если кто-то не понял — это было «Монголо-Забайкальская система.». И так 84 страницы. Увы.
Автор умолчал о некоторых ограничениях данных сервисов. Возможно Ваш скан был не очень хорошего качества(в отличии от примеров автора).
спасибо автору статьи за информацию, но мне очень неприятно было прочитать текст на первой картинке для распознавания. Пожалуйста, выбирайте для примеров что-нибудь позитивное или нейтральное.
Благодарю! Статья и ссылки на нужные безоплатные сайты, очень кстати.
Вот норм сервис, но с перевернутыми не работает http://testiiko.wixsite.com/docscan