fbpx
1.4 C
София

Linux: извличане на текста от изображения и PDF файлове с помощта на gImageReader

Най-четени

Даниел Десподов
Даниел Десподовhttps://www.kaldata.com/
Ежедневен автор на новини. Увличам се от съвременни технологии, оръжие, информационна безопасност, спорт, наука и концепцията Internet of Things.

Ако сте студент или вашата работа е свързана с многобройни изображения и/или PDF файлове, в един момент ще ви се наложи да извлечете текста от тях. За щастие, това не е трудно да се направи. В Linux средата има няколко много добри софтуерни инструмента, които могат да се използват за тази цел. Една от многобройните програми от подобен род е gImageReader. Това е безплатно приложение, което работи с най-различни формати на изображенията, както и с PDF документи.

Нека се спрем малко по-подробно на gImageReader и да разгледаме как можем да използваме този инструмент за извличане на текстовете от изображенията и PDF файловете.

Какво е gImageReader

gImageReader е приложение, което дава възможност за извличане на текстовете от снимки, изображения и PDF файлове в Linux среда. На практика това е много удобен графичен интерфейс за технологията на за разпознаване на текст Tesseract на Hewlett-Packard. Това е безплатен OCR софтуер с отворен код, който е един от най-добрите механизми за разпознаване на текст.

С помощта на gImageReader е възможно лесното и достатъчно точно извличане на текстовете от изображенията и PDF документите с помощта на само няколко клика с компютърната мишка. След това е възможно този текст да записан в текстов файл или като PDF документ, който може многократно да се използва за нещо друго.

Основни възможности на gImageReader:

  • Импортиране на PDF документи и най-различни снимки и изображения от различни източници – диск, скенер, клипборд и скрийншотове
  • Пакетна обработка на изображенията и и документите – тоест, няколко документа или изображения едновременно
  • Разпознаване на различните текстови фрагменти като обикновен текст или hOCR документи
  • Вградена проверка на правописа
  • Автоматично определяне на различните области с текст
  • Базово редактиране на изображенията и документите
  • Запазване на полученото във вид на стандартен текстови документ

Инсталиране на gImageReader в Linux

Приложението gImageReader е достъпно в почти всички съвременни дистрибуции. Но за неговата работа е необходимо в компютърната система предварително да бъде инсталиран механизмът за разпознаване на текст Tesseract.

За тази цел е необходимо в стандартния Софтуерен мениджър на съответната Linux дистрибуция да се потърси думата tesseract. Когато резултатите се върнат, необходимо е да бъдат инсталирани пакетите tesseract-ocr и tesseract-ocr-eng.

Забележка: за да може OCR механизмът да работи и за българския език е необходимо отново от Софтуерния мениджър да бъде инсталиран пакетът Tesseract-ocr-bul:

По подобен начин се инсталират необходимите програмни пакети за другите езици.

Следва инсталирането на самия gImageReader, което става най-лесно чрез терминала.

Ако използвате Debian или Ubuntu в терминала трябва да се въведат следните команди:

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt install gimagereader

В дистрибуциите Fedora, CentOS и Red Hat Enterprise Linux (RHEL) трябва да се въведе следното:

sudo dnf install gimagereader-qt 

В Arch Linux и Manjaro в терминала е необходимо да напише следното:

sudo pacman -S gimagereader

Потребителите на openSUSE могат да инсталират gImageReader по следния начин:

sudo zypper install gimagereader

Ако използвате някаква друга Linux дистрибуция винаги можете да компилирате gImageReader от неговия сорс код, като е много удобно да се следват инструкциите, дадени в GitHub (github.com/manisandro/gImageReader/wiki/Compiling-gImageReader).

Използването на gImageReader в средата на Linux

gImageReader е съвсем лесен за използване и работи с почти всички графични формати на изображенията, както и с PDF документи. Нека да се спрем на няколкото основни стъпки за използването на този OCR софтуер.

Стартирането на gImageReader става от основното меню, където просто трябва да се намери подточката „gImageReader“. Най-добре е приложението да бъде максимизирано на цял екран.

Сега трябва да се кликне върху Add images в левия панел под реда с инструментите. Появява се нещо като браузър, откъдето трябва да избере изображение или PDF файл, от които трябва да бъде разпознат и изваден текста.

Достатъчно е да се кликне върху ОК, за да се зареди изображението или PDF документа в gImageReader. А ако искате да разпознаете и извлечете текста от съдържимото на екрана, трябва да се кликне върху съседния бутон Take Screenshot и приложението ще направи скрийншот на екрана.

След като изображението бъде заредено в gImageReader е необходимо да се кликне върху бутона Toggle output pane с иконка на бележник, за да се отвори панелът за извеждане на разпознатото. Именно тук се появява текстът, който е извлечен от избраното изображение или PDF документ.

Както много други програми от подобен род сега можете да идентифицирате блоковете от текст ръчно или автоматично. За автоматичен процес е необходимо да се избере Autodetect layout, след което програмата автоматично ще разпознае и фиксира различните текстови блокове от избраното изображение или PDF файл.

След това трябва да се кликне върху Recognize selection>Current Page, за да започне OCR процеса и извличането на текста.

Ако сте избрали ръчна работа с блоковете текст, то съответният блок трябва да бъде избран ръчно с помощта на мишката. Необходимо е с помощта на мишката да се направи рамка около избраната област и след това да се кликне върху Recognize selection.

Ако това е PDF документ с няколко страници, може да бъде натиснат бутонът + за отиване към следващата страница.

Логично, връщането с една страница назад става с помощта на клавиша -.

Да допълним, че има редица случаи когато gImageReader трябва да разпознае и върне текст, който не е на английски език. В този случай е необходимо от падащото меню, което се разкрива от иконката до бутона Recognize selection да се избере съответния език, за да може оптичното разпознаване на текста да бъде осъществено вярно и правилно.

И накрая, за записването на разпознатия текст е необходимо да се кликне върху бутона Save output, след което ще се появи програмния прозорец за запис на файла. Достатъчно е да се зададе име на файла и да се натисне ОК.

Какво още може да прави gImageReader

Както казахме по-горе, gImageReader дава още и възможност за извършване на промени в известни аспекти на заредените в програмата изображение или PDF документи, като например яркост, контраст и резолюция. Освен това, при необходимост има възможност за инвертиране на цветовете или завъртането на съответното изображение или документ.

Тези промени са много удобни, когато се работи с размазан текст и gImageReader се затруднява да разпознава този текст, като тези най-различни промени подобряват оптичното разпознаване на символите.

За да се получи достъп до тези параметри за базово редактиране на изображенията е необходимо да се кликне върху бутона Image Controls, след което под основния ред с инструменти ще се появи нов малък панел за достъп до допълнителните параметри. Оттам могат да се използват различните бутони, за да се осъществи желаната базова редакция на изображението.

 Благодарение на gImageReader извличането на текста от изображенията стана много по-лесно

Оптичното разпознаване на символите и извличането на текст често изисква правилния софтуерен инструмент: такъв, който използва стабилен и точен OCR енджин, който дава възможност за ефективно идентифициране на текста в изображенията и PDF документа по такъв начин, че да може да бъде извлечен без каквито и да било проблеми и излишно губене на време.

Приложението gImageReader отлично се справя с тази задача благодарение на OCR механизма Tesseract, който работи във фонов режим. Като се има предвид лекотата на неговото използване, gImageReader наистина е един от най-добрите инструменти за извличане на текст от изображенията, създаден за Linux средата.

Ако търсите някакво още по-опростено решение за оптично разпознаване на символите можете да използвате приложението TextSnatcher, което работи бързо и е сравнително лесно за използване.


Коментирайте статията в нашите Форуми. За да научите първи най-важното, харесайте страницата ни във Facebook, и ни последвайте в Telegram и Viber или изтеглете приложението на Kaldata.com за Android, iOS и Huawei!

Абонирай се
Извести ме за
guest

12 Коментара
стари
нови оценка
Отзиви
Всички коментари

Нови ревюта

Подобни новини