2024/09/18
このページをブックマークしてください。
光学式文字認識(OCR)
スキャンされたドキュメント、ドキュメントの写真、シーンの写真(たとえば、風景の中の看板や看板のテキスト)から、入力、手書き、または印刷されたテキストの画像を機械でエンコードされたテキストに電子的または機械的に変換することです。写真)、または画像に重ねられたサブタイトルテキストから(例:テレビ放送から)。
パスポート、請求書、銀行の明細書、コンピューター化された領収書、名刺、郵便、静的データの印刷、またはその他の適切な文書など、印刷された紙の記録からデータを入力するために広く使用されています。電子的に編集、検索、よりコンパクトに保存、オンラインで表示、コグニティブコンピューティング、機械翻訳、(抽出された)テキストからspへのOCRなどの機械プロセスで使用されるOCRは、人工知能とコンピュータビジョン。
以前のバージョンでは、個々の文字の写真を使用したトレーニングが必要であり、一度に1つの書体で作業していました。多数のデジタル画像ファイル形式を入力として受け入れるシステムと同様に、大部分の書体に対して高度な識別精度を提供できる高度なシステムが現在広く利用可能です。特定のシステムは、グラフィック、列、およびその他の非テキストコンポーネントを含め、元のページにできるだけ類似したフォーマットされた出力を複製することができます。