Tesseract

У Вікіпедії є статті про інші значення цього терміна: TesseracT (гурт).
Tesseract
Тип OCR
Розробник Hewlett-Packard, Google
Стабільний випуск 3.02 (28 жовтня 2012)
Операційна система Windows, Linux, Mac OS X
Мова програмування C C++
Ліцензія Apache 2.0
Онлайн-документація github.com/tesseract-ocr/tessdoc
tesseract-ocr.github.io
Репозиторій github.com/tesseract-ocr/tesseract
Вебсайт tesseract-ocr.googlecode.com

Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[джерело?] її та відкрив початковий код під ліцензією Apache 2.0 у 2006 році.[2] для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська.

Застосування

Tesseract був використаний, зокрема, Міжнародним консорціумом журналістів-розслідувачів для дослідження інформації у так званих «панамських документах»[3].

Примітки

  1. http://www.isri.unlv.edu/ISRI/Software#Experimental_Open_Source_OCR
  2. Vincent, Luc (August 2006). Announcing Tesseract OCR. Архів оригіналу за 18 березня 2012. Процитовано 26 червня 2008.
  3. Mar Cabra, Erin Kissane (11 квітня 2016). The People and Tech Behind the Panama Papers. opennews.org. An OpenNews project. Архів оригіналу за 11 квітня 2016. Процитовано 18 квітня 2016.

Див. також

Посилання

  • Сторінка завантажень (компіляції, мовні пакети, вихідні коди) [Архівовано 18 березня 2012 у WebCite]
  • Керівництво з навчання програми мові [Архівовано 5 березня 2009 у Wayback Machine.] (рос.)


Програмне забезпечення Це незавершена стаття про програмне забезпечення.
Ви можете допомогти проєкту, виправивши або дописавши її.
Ця стаття потребує додаткових посилань на джерела для поліпшення її перевірності. Будь ласка, допоможіть удосконалити цю статтю, додавши посилання на надійні (авторитетні) джерела. Зверніться на сторінку обговорення за поясненнями та допоможіть виправити недоліки.
Матеріал без джерел може бути піддано сумніву та вилучено.
(квітень 2016)

П:  Портал «Програмування» П:  Портал «Вільне програмне забезпечення»

  • п
  • о
  • р
Програми з використанням оптичного розпізнавання символів
Вільне програмне забезпечення
CuneiForm · GOCR · Ocrad · OCRopus · Tesseract
Власницьке програмне забезпечення
Expervision · ABBYY FineReader · Microsoft Office Document Imaging · OmniPage · Readiris · ReadSoft  · SimpleOCR · SmartScore · ViewWise