Optische Zeichenerkennung (ocr)

Definition - Was bedeutet optische Zeichenerkennung (OCR)?

Die optische Zeichenerkennung (OCR) bezieht sich sowohl auf die Technologie als auch auf den Prozess des Lesens und Konvertierens von getippten, gedruckten oder handgeschriebenen Zeichen in maschinencodierten Text oder etwas, das der Computer manipulieren kann. Es ist eine Teilmenge der Bilderkennung und wird häufig als Form der Dateneingabe verwendet, wobei die Eingabe eine Art gedrucktes Dokument oder Datensatz wie Kontoauszüge, Verkaufsrechnungen, Pässe, Lebensläufe und Visitenkarten ist. Das Dokument wird entweder gescannt oder es wird ein Bild aufgenommen. Es ist Sache des Programms, die Zeichen zu erkennen und eine Ausgabe in Form eines Textdokuments zu geben.

Technische.me erklärt die optische Zeichenerkennung (OCR)

Optische Zeichenerkennung ist die Erkennung sprachspezifischer Zeichen durch einen Computer durch Analyse eines Bildes, das bereits computerlesbar ist. Dies geschieht häufig, indem Sie zuerst ein Bild des Dokuments aufnehmen, indem Sie es scannen oder ein digitales Bild aufnehmen. Dadurch wird ein Rasterbild erstellt, das aus Daten besteht, die der Computer versteht, und durch speziell programmierte Algorithmen, von denen die meisten auf dem Gebiet der künstlichen Intelligenz verwendet werden, erkennt der Computer die Muster im Bild, und in diesem Fall sind die Muster Zeichen. Das Programm erstellt oder gibt dann Zeichencodes aus, normalerweise ASCII, die den erkannten Zeichen aus dem Eingabebild entsprechen. Die meisten OCR-Programme müssen geschult werden, damit sie Zeichen besser erkennen können.