Автоматизирано извличане на данни от цифрови изображения на документи

Тодор Рачовски, Георги Тотков, Десислав Десев

Резюме: Представени са експерименти със софтуерни модули за извличане на елементарни и структурирани данни от цифрови изображения, създавани в рамките на интегрирана информационна система на Пловдивския университет "Паисий Хилендарски", наречена Пловдивски електронен университет (ПеУ). Интеграцията е базирана на многофункционален дигитален университетски архив – първият по рода си в страната. Успешното създаване на подобен архив предполага и проектиране и създаване на софтуерни средства за извличане на данни (таблици – с разграничаване на редове, стълбове и клетки, текстове на кирилица, числа и др. под.), съставени от знаци, изписани с различни видове шрифтове.
Форум на Пловдивски електронен университет (ПеУ)
Пловдивски електронен университет (ПеУ)
Настоящият уеб сайт е създаден по проект BG051PO001-4.3.04-0064 "Пловдивски електронен университет (ПеУ): национален еталон за провеждане на качествено е-обучение в системата на висшето образование", с финансовата помощ на Европейския социален фонд.
Пловдивски университет "Паисий Хилендарски" носи цялата отговорност за съдържанието на сайта,
и при никакви обстоятелства не може да се приеме като официална позиция на Европейския съюз.