О проекте

img2txt


Информация о сервисе:

Сервис позволяет получить текст из изображения путем оптического распознавания символов (OCR). Для распознавания текста необходимо подготовить нужное изображение и загрузить его, далее следует выбрать язык на котором написан текст, после чего Вы получите результат.
Очень важно, что бы изображение было в хорошем качестве, а текст в горизонтальном положении.

Сервис запустился примерно 07.04.2014, точной даты увы нет, эту дату нам подсказала wayback machine. Если Вам интересно что и когда добавлялось, то Вы можете посмотреть нашу историю изменений. Также у нас есть много планов насчет функционала, но мы будем рады и Вашим идеям которые Вы можете отправить нам .

Страница ToS будет опубликована позже.



Технологии

Для распознавания используется Tesseract. Сайт написан на PHP с использованием MVC. Имеется своя API (непубличная), также запланированы собственные алгоритмы для улучшения обработки распознаваний.

Запросы обслуживает несколько VPS серверов, при всплесках нагрузок включаются дополнительные сервера.



История изменений:

  • 0.2 Выбор неск. языков для распознавания
  • 0.2.2 Добавлен еще один сервер + мелкие правки
  • 0.3 Добавлена страница Мои запросы + возм. просмотреть и скачать файл оригинала
  • 0.3.1 Новый текст страницы о сервисе.
  • 0.3.2 Добавлено 11 языков: Dutch, Czech, Danish, Greek, Estonian, Finnish, Latvian, Lithuanian, Romanian, Slovakian, Slovenian
  • 0.4 Добавлена мультиязычность (Русский, Английский и Украинский), рефакторинг кода, улучшен дизайн сайта.
  • 0.4.1 Переход на защищенное соединение HTTPS.
  • 0.4.2 Добавлена поддержка 10ти языков: Azerbauijani, Bulgarian, French, Hungarian, Norwegian, Portuguese, Spanish, Serbian, Swedish, Turkish.
  • 0.4.3 Добавлено три новых языка интерфейса: Итальянский, Испанский и Немецкий.
  • 0.4.4 Мы провели сборы статистики того какие форматы Вы пытаетесь заливать, пока что мы добавили BMP, и сейчас активно работаем над реализацией поддержки PDF!.
  • 0.4.5 Добавлен Польский язык интерфейса.
  • 0.4.6 Добавлен Французский язык интерфейса. Переписана обработка AJAX и Cli вызовов и много по мелочам.
  • 0.4.7 Добавлена бета поддержка чтения PDF документов. Нарисован новый дизайн, и сверстан :)
  • 0.5.x Ближайшие планы – Внедрить редизайн, а после куча новых фич... И возможно переход на Laravel


Рекомендуем сервис по отправке SMS.

Реклама