Skip to main content

Optical Character Recognition

Wat houdt OCR in? Hoe kan het u helpen?
U leest het in dit artikel en de aanverwante artikelen.

Het begrip uitgelegd

Optical Character Recognition (OCR) is een techniek waarbij gedrukte tekst kan worden herkend, middels patroonherkenning. Statische tekst van een gescanned document kan worden omgezet in bewerkbare tekst.
Bij contextuele OCR worden initiƫle OCR resultaten gebruikt voor verdere analyses. Dit kan u helpen om bijvoorbeeld een document als factuur te herkennen omdat deze altijd specifieke gegevens bevat (Factuurnummer, totalen, leverancier, debiteurnummer).

Toepassing

OCR helpt u bij het automatisch herkennen en indexeren van documenten in bijvoorbeeld uw post- of formulieren stroom. Documenten worden ingescanned, herkend op basis van een patroon en voorzien van indexkenmerken (metadata), die ge-extraheerd worden uit de tekst in combinatie met bijvoorbeeld ICR. Door deze indexkenmerken kan een document later weer gevonden worden in het digitaal archief, maar deze kunnen ook een rol spelen in processturing, de zogehete workflow.
  • Factuur herkenning en verwerking
  • Automatisch herkennen van documenten
  • Automatische metadatering

Wat is Intelligent Character Recognition (ICR)?

Wat houdt ICR in? Hoe kan het u helpen? U leest het in dit artikel en de aanverwante artikelen.
ICR staat voor Intelligent Character Recognition, oftewel het herkennen van handgeschreven tekst, daar waar OCR gedrukte of geprinte tekst herkent. Handschriftherkenning (ICR) is een stuk lastiger dan het herkennen van gedrukte tekst vanwege de verschillende handschriften. Voor het automatisch lezen van ingevulde formulieren kan het echter uitstekend worden ingezet.