【解決方法】画像をテキストに変換する


やあ、
スキャンした画像をテキストに変換する C# Windows アプリケーションを作成したいと考えています。 C#.Net で可能ですか。 アイデアがあれば助けてください。

codeproject自体の記事を検索しました。 しかし、機能していないようで、まさに私の要件ではありません。 スキャナーからテキストを含む画像を取得します。 画像内のそのテキストを変換する必要があります。 .NetまたはJavaを使用してそれは可能ですか?

解決策 3

あなたが言及しているのは、光学式文字認識(OCR)と呼ばれます。 OCR の方法に関する CodeProject に関するすばらしい記事がたくさんあります。 それらのいくつかは無料の方法について語っていますが、私の経験から、それらは精度が低いか、次のような多くの機能を提供していません。
http://www.codeproject.com/Articles/238114/Realtime-Webcam-Sudoku-Solver (OCR よりも多くのことを行いますが、OCR 部分は Sudoku パズルの数字に固有のものです)
Visual C++ の MODI を使用した OCR (C++ では MS コントロールを使用しますが、C# でも同じコントロールを使用できます)。

一方、より多くの機能とより高い精度を提供する商用ツールキットがいくつかあります。 次のリンクで、それらのいずれかに関する記事を見つけることができます。
LEADTOOLS を使用した OCR: より良い選択

解決策 1

解決策 2

EmguCV を使用してこれを実現できます。

http://www.emgu.com/wiki/index.php/License_Plate_Recognition_in_CSharp[^]

解決策 4

私の経験では、これに適したオープンソースの解決策はなく、商用コンポーネントしかありません。

そのため、商用のものをいくつかチェックして、特定のケースでどれがより速く実行され、ミスが少ないかを確認してから、1つを選択することをお勧めします. 価格も要因になる可能性があります。

しかし、このテーマについてオープンソースを調べ始めると、長い間そこに行き詰まる可能性があり、結果は速度とエラーの両方の点で悲惨なものになります.

解決策 8

私は自分のプロジェクトで 3 種類のテキスト検出を個人的に使用しています。

Tesseract (emgucv に含まれる) – 少し遅い IMO を実行します。

emgucv には、emgu.dnn 名前空間で使用できるテキスト検出モデルとテキスト認識モデルがあります。
検出率は良好ですが、ニーズに合わせて手動で調整する必要があり、1 行のコードを使用する方法はありません …

3 番目の方法は Windows 10 ocr です。これは非常に高速で、無料で使用できます。 windows.media.ocr を Google で検索すると見つかります。

コメント

タイトルとURLをコピーしました