Како функционише ОЦР? Објашњено на једноставан и разумљив начин
У овом чланку објашњавамо како функционише ОЦР. ОЦР означава „Оптичко препознавање знакова“ и на њемачком се једноставно назива препознавањем текста. То значи да рачунар може препознати текст на скенираној слици помоћу ОЦР-а и затим га претворити у једноставан текстуални документ.
Овако функционише ОЦР
Замислите да сте добили реферат на папиру од колеге. Сада их желите да измените на ПЦ-у јер не волите појединачне одломке. Зато је скенирајте и идите на ОЦР програм. Сада се дешава следеће:
- Софтвер прво ради такозвану анализу изгледа. Да би то учинила, она прегледа изглед странице и одваја слике од текста. Она такође бележи њихов положај на страници. Тада се броји број одломака и спремају се поједини елементи попут бројева страница.
- Сада долази тешки део. Софтвер прегледава појединачне блокове текста и рашчлањује их на реченице. Реченице се затим деле на појединачне речи, а речи у слова.
- ОЦР софтвер садржи обрасце слова и знакова. Програм сада упоређује скенирана слова са овим обрасцима. Ако су 99% слични, алгоритам одлучује да то вероватно мора бити то слово. Веома је прецизан јер може да упореди многе обрасце за кратко време. На овај начин он успешно прави разлику између „8“ и „Б“.
- Тако се слова и знакови постепено препознају. Затим се поново комбинују као речи и враћају на своје место у реченици. Чим је софтвер завршен, цела ствар се чува у уобичајеном документу, који можете потом уређивати. Готово!
Да ли желите да тестирате своје знање о софтверу? Учествујте у нашем великом квизу софтвера!