|
Автоматизирано извличане на данни от цифрови изображения на документи Тодор Рачовски, Георги Тотков, Десислав Десев Резюме: Представени са експерименти със софтуерни модули за извличане на елементарни и структурирани данни от цифрови изображения, създавани в рамките на интегрирана информационна система на Пловдивския университет "Паисий Хилендарски", наречена Пловдивски електронен университет (ПеУ). Интеграцията е базирана на многофункционален дигитален университетски архив – първият по рода си в страната. Успешното създаване на подобен архив предполага и проектиране и създаване на софтуерни средства за извличане на данни (таблици – с разграничаване на редове, стълбове и клетки, текстове на кирилица, числа и др. под.), съставени от знаци, изписани с различни видове шрифтове. |
|