Algoritmusok OCR előkészítéshez
2011-10-19T14:45:34+02:00
2011-10-21T11:50:21+02:00
2022-07-19T04:52:30+02:00
  • Köszönöm a segítséget, sikerült egy használható megoldást találnom ezzel az élkiemeléses módszerrel.

    Mutasd a teljes hozzászólást!
  • Egy mai gépnek nem ügy végigmenni egy 250x100-as kép pontjain.
    Ha az élkiemelt képet jól küszöbölöd, akkor az élek fehérek, a többi fekete lesz. Ha ezután kigyűjtöd, hány világos pont van az egyes sorokban, akkor igen jó esélyed van megtalálni a felső és az alsó élt. Kis szerencsével a széleit is megkapod, vagyis máris kivághatod a képből, és a számjegyek helyére is lesz egy jó tipped. És a helyek alapján (az eredeti képen) már könnyebben mehet a felismerés. Én legalábbis valószínűleg ezt csinálnám.

    Hirtelen nem ugrik be más általános alakzatkeresési módszer. Szerintem jellemzően ezt a kettőt szokták. Vagy éleket keresnek, és azokból próbálnak foltokat építeni, vagy egyszínű összefüggő területeket próbálnak felfedezni. De szerintem itt ha csak úgy keresgélsz, mindenféle (kosz, dísz, háttér) foltokat fogsz kapni, amiket később nem nagyon tudsz majd mi alapján szétválogatni.
    Mutasd a teljes hozzászólást!
  • A számsor vízszintes (többé-kevésbé).
    Megnéztem az élkiemelést, csak nem értem, hogy ez hogyan segít a keret megtalálásában? Ha elvégzek a képeken egy élkiemelést, akkor azt kapom, hogy a képen csak a számok és a keret marad egy-egy vonalként (na jó, a számok két vonalként), de innen nem tudom, hogyan tovább.

    Milyen algoritmussal lehet amúgy a képen alakzatokat keresni? Itt többször írod, hogy keressek a képen többé-kevésbé vízszintes vonalat - ez még menne -, de nincs valami módszer egyéb alakzatok keresésére?
    Mutasd a teljes hozzászólást!
  • hát ha rácsban van, annak elvileg könnyítenie kellene. Következő kérdés, hogy vízszintes-e, vagy ferde.

    A keretet elvileg élkiemeléssel találod meg, én legalábbis azt próbálnám, hacsak nem mindegyiknél hasonlóak a fényviszonyok, mert akkor egyszerűbb lehet többé-kevésbé vízszintes sötét vonalat keresni. Ez azért is jó, mert ha megtalálod a dőlésszöget, akkor annyival elforgathatod az egész képet, és könnyítesz a számfelismerésen.

    Ha a mérőeszközök mindig ugyanolyanok, akkor a keret megtalálásával egyben azt is megtudod, hogy az egyes számok hol vannak. Utána pedig vághatsz, és küszöbölhetsz egyesével.

    Mutasd a teljes hozzászólást!
  • Kösz a választ.
    Nem rendszámok, arra sok megoldás van a neten, hanem forgótárcsás számlapok, mint a vízóra meg a többi ilyen (szerencsére legalább olyan nincs, hogy egy számnak a fele látszódik, ennél a cuccnál ugrik a szám).
    A számok mind egy sorban helyezkednek el és összesen 6 digitet tartalmaznak. A képek nem túl nagyok, kb. 250*100-as nagyságúak, ennek nagy része a számsor, csak minden szám rendelkezik egy kerettel (mélyedésben van), ami árnyékot vet és bezavar az OCR-ben.
    Pont ezért gondolkodnék olyan megoldásban, hogy ha meg tudnám határozni, hogy hol vannak a számok és milyen szélesek, akkor a kép többi részét egyszerűen kifehéríteném. Kérdéses, hogy ezt milyen algoritmussal lehet megtenni.
    Mutasd a teljes hozzászólást!
  • Jó volna látni a képeket, hogy kiderüljön, mit jó használni rájuk.

    Nagy általánosságban a zaj szűrhető elmosással, ha a felbontásod jó, és a számok elég nagyok. Másik lehetőséged, hogy első körben valahogy megbecsülöd, hogy hogyan helyezkednek el (több számjegy egy sorban, vagy ilyesmi), és akkor a többi részt ki lehet zárni. Szintén megnézheted, hogy hátha a számok nem teljesen feketék, hanem valamilyen szín sötét árnyalatai. Illetve olyan megközelítés is működhet, hogy ha tudsz valami többet a tárgyakról, amiken vannak, akkor először a tárgyakat keresed meg, és utána a számokat rajtuk.

    Amit leírtál, abból ennyi ugrott be. Rendszámok ezek? Szkennelt számlák?

    Mutasd a teljes hozzászólást!
  • Sziasztok,

    Egy elég érdekes problémát kellene megoldanom és mivel nem nagyon vagyok járatos a képfeldolgozásban, ezért fordultam hozzátok.
    A feladat az lenne, hogy fényképről kellene OCR-t végrehajtani. A fényképen különböző tárgyak vannak, amiken 5-10 szám van, amit fel kellene ismertetni, a tárgyak alapszíne fehér (néhol koszos fehér) a számok meg feketék.
    Úgy gondoltam, hogy ez nem lesz túl bonyolult, de tévedtem. Az OCR-be nagyon belezavarnak az árnyékok a képen, a fény tükröződése és még egyéb ilyen dolgok, az sem sokat segít, hogy képenként más az élesség és a fényviszony.
    Sokat gondolkodtam, hogy mit lehetne tenni, részleges megoldást találtam is a Thresholding alg. segítségével, de ez nem mindig elegendő az eddigi tesztek alapján.

    Az egyik kérdésem az, hogy szerintetek milyen algoritmusokkal érdemes még próbálkozni, ami segíthet?
    A következő az, hogy van e arra algoritmus, hogy hogyan lehetne esetleg valamilyen információ alapján megkeresni a képen a számokat és azokat körbevágni (kidobni a felesleges zavarást)?
    Mutasd a teljes hozzászólást!
abcd