Vad är optisk teckenigenkänning (OCR)?

Innehållsförteckning:

Vad är optisk teckenigenkänning (OCR)?
Vad är optisk teckenigenkänning (OCR)?
Anonim

Optical Character Recognition (OCR) hänvisar till programvara som skapar en digital version av ett tryckt, maskinskrivet eller handskrivet dokument som datorer kan läsa utan att behöva skriva eller skriva in texten manuellt. OCR används vanligtvis på skannade dokument i PDF-format, men kan också skapa en datorläsbar version av text i en bildfil.

What OCR Is

OCR, även kallad textigenkänning, är mjukvaruteknik som omvandlar tecken som siffror, bokstäver och skiljetecken (även kallade glyfer) från tryckta eller skrivna dokument till en elektronisk form som är lättare att känna igen och läsa av datorer och andra program. Vissa OCR-program gör detta eftersom ett dokument skannas eller fotograferas med en digitalkamera och andra kan tillämpa denna process på dokument som tidigare har skannats eller fotograferats utan OCR. OCR tillåter användare att söka i PDF-dokument, redigera text och formatera om dokument.

Image
Image
Skanna historisk tidning med OCR-programvara.

Getty Images

Vad används OCR till?

För snabba, vardagliga skanningsbehov kanske OCR inte är en stor sak. Om du gör en stor mängd skanning kan det spara en hel del tid att kunna söka i PDF-filer för att hitta den du behöver och göra OCR-funktionaliteten i ditt skannerprogram viktigare. Här är några andra saker OCR hjälper med:

  • Automatisk databehandling och datainmatning (Exempel: Spårningssystem för jobbsökande för meritförteckningar).
  • Gör skannade böcker sökbara.
  • Konvertera handskrivna skanningar till datorläsbar text.
  • Göra dokument mer användbara av läsarprogram som hjälper synskadade användare.
  • Bevara historiska dokument och tidningar, samtidigt som de görs sökbara.
  • Dataextraktion och överföring till redovisningsprogram (exempel: kvitton och fakturor).
  • Indexering av dokument för användning av sökmotorer.
  • Igenkänning av körkortsskyltar av en fartkamera och programvara för rödljuskamera.
  • Talsyntes för människor som inte kan tala – teoretisk fysiker, Stephen Hawking, är kanske den mest kända användaren av ett talsyntesprogram.

Bottom Line

Varför inte bara ta en bild, eller hur? Eftersom du inte skulle kunna redigera någonting eller söka i texten eftersom det bara skulle vara en bild. Genom att skanna dokumentet och köra OCR-programvara kan den filen förvandlas till något du kan redigera och söka efter.

History of OCR

Medan den allra tidigaste användningen av textigenkänning dateras till 1914, började den utbredda utvecklingen och användningen av OCR-relaterade teknologier på allvar på 1950-talet, särskilt med skapandet av mycket förenklade typsnitt som var lättare att konvertera till digit alt- läsbar text. Det första av dessa förenklade typsnitt skapades av David Shepard och är allmänt känt som OCR-7B. OCR-7B används fortfarande idag i finansbranschen för standardteckensnittet som används på kreditkort och betalkort. På 1960-talet började posttjänster i flera länder använda OCR-teknik för att avsevärt påskynda postsortering, inklusive USA, Storbritannien, Kanada och Tyskland. OCR är fortfarande kärntekniken som används för att sortera post för posttjänster runt om i världen. År 2000 användes nyckelkunskaper om OCR-teknikens gränser och möjligheter för att utveckla CAPTCHA-programmen som används för att stoppa bots och spammare.

Under årtiondena har OCR blivit mer exakt och mer sofistikerad på grund av framsteg inom relaterade teknikområden som artificiell intelligens, maskininlärning och datorseende. Idag använder OCR-programvara mönsterigenkänning, funktionsdetektering och textutvinning för att transformera dokument snabbare och mer exakt än någonsin tidigare.

FAQ

    Hur skannar jag dokument med min telefon eller surfplatta?

    På iOS öppnar du Notes-appen och skapar en ny anteckning. Öppna kameran och tryck sedan på Skanna dokument. På Android, öppna Google Drive och välj Plus (+), tryck sedan på Scan för att skanna dokument med din telefon.

    Hur använder jag OCR i Adobe Acrobat?

    Öppna en PDF-fil som innehåller en skannad bild och välj sedan Verktyg > Redigera PDF. Acrobat kommer automatiskt att tillämpa OCR så att du kan redigera texten. Välj bara var du vill göra ändringar och börja skriva.

    Vad är skillnaden mellan OCR och OMR?

    Optical Mark Recognition (OMR) är programvara som upptäcker märken på papper, vanligtvis ett bubbelark. OMR används för att bearbeta resultaten av tentor, undersökningar, frågeformulär och till och med val. Till skillnad från OCR kan OMR inte tyda märkena på sidan, utan bara verifiera att märkena finns där.

Rekommenderad: