チュートリアル

簡単にライブラリーを使用するためのチュートリアルコレクション

Displaying items by tag: OCR

Spire.OCR for .NET は、プロフェッショナルな OCR ライブラリであり、.NET Framework および .NET Core アプリケーションで画像(JPG、PNG、GIF、BMP、TIFF など)からテキストを認識することをサポートします。本記事では、Spire.OCR for .NET を使用して .NET Framework アプリケーションで画像からテキストを抽出する方法を説明します。

具体的な手順は以下の通りです。

1. Visual Studio でコンソールアプリ (.NET Framework) を作成する

まず、Visual Studio を使用して .NET Framework を対象としたコンソールアプリを作成します。

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

2. アプリケーションのプラットフォームターゲットを x64 に変更する

アプリケーションのソリューションエクスプローラーでプロジェクト名を右クリックし、「プロパティ」を選択します。

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

プラットフォームターゲットを x64 に変更します。この手順は必須で、Spire.OCR が 64 ビットプラットフォームのみをサポートしているためです。

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

3. Spire.OCR for .NET をアプリケーションにインストールする

NuGet を使用して Spire.OCR for .NET をインストールします。以下のコマンドを NuGet パッケージマネージャーコンソールで実行してください。

Install-Package Spire.OCR

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

4. Spire.OCR for .NET の新しいモデルをダウンロードする

お使いのオペレーティングシステムに適したモデルを以下のリンクからダウンロードしてください。

次に、パッケージを解凍し、コンピューター上の特定のディレクトリに保存します。この例では、パッケージを "D:\" に保存しました。

C#:Spire.OCR for .NET を使用して画像からテキストを抽出する方法

5. C# で Spire.OCR for .NET を使用して画像からテキストを抽出する

以下のコード例は、C# を使用して Spire.OCR for .NET の新しいモデルで画像からテキストを抽出する方法を示しています。

  • C#
using Spire.OCR;
using System.IO;

namespace NewOCRModel
{
    internal class Program
    {
        static void Main(string[] args)
        {
            // ライセンスキーを設定
            // Spire.OCR.License.LicenseProvider.SetLicenseKey("your-license-key");

            // OcrScanner クラスのインスタンスを作成
            OcrScanner scanner = new OcrScanner();

            // スキャナー構成を設定するために ConfigureOptions クラスのインスタンスを作成
            ConfigureOptions configureOptions = new ConfigureOptions();

            // モデルのパスを設定
            configureOptions.ModelPath = "D:\\win-x64";

            // テキスト認識の言語を設定します。デフォルトは英語です。
            // サポートされている言語には、英語、中国語、中国語繁体字、フランス語、ドイツ語、日本語、韓国語があります。
            configureOptions.Language = "English";

            // 構成オプションをスキャナーに適用
            scanner.ConfigureDependencies(configureOptions);

            // 画像からテキストを抽出
            scanner.Scan("test.png");

            // 抽出したテキストをテキストファイルに保存
            string text = scanner.Text.ToString();
            File.WriteAllText("Output.txt", text);
        }
    }
}

一時ライセンスを申請する

結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、についてこのメールアドレスはスパムボットから保護されています。閲覧するにはJavaScriptを有効にする必要があります。にお問い合わせ、30 日間有効な一時ライセンスを取得してください。

Published in Spire.OCR for .NET
Tagged under

OCR(光学文字認識)技術は、画像からテキストを抽出するための主要な方法です。Spire.OCR for Java は、Java プロジェクトにおいて画像からテキストをスキャンして抽出するための迅速かつ効率的なソリューションを提供します。本記事では、Spire.OCR for Java を使用して、画像からテキストを認識・抽出する方法を解説します。

Spire.OCR for Java のインストール手順

Spire.OCR for Java を使用して画像内のテキストをスキャンおよび認識するには、まず Spire.OCR.jar ファイルとモデルファイルを Java プロジェクトにインポートする必要があります。

以下は、Spire.OCR for Java とモデルファイルを Java プラグラムにインストールする手順です:

1. IntelliJ IDEA で Java プロジェクトを作成する

最初に、IntelliJ IDEA を使用して新しい Java プロジェクトを作成します。

Java:画像からテキストを抽出する方法(OCR)

2. プロジェクトに Spire.OCR.jar を追加する

オプション 1:Maven を使用して Spire.OCR for Java をインストールする

Maven を使用している場合、次のコードをプロジェクトの pom.xml ファイルに追加することで、Spire.OCR for Java をインストールできます:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.ocr</artifactId>
        <version>1.9.19</version>
    </dependency>
</dependencies>

オプション 2:Spire.OCR.jar を手動でインポートする

まず、以下のリンクから Spire.OCR for Java をダウンロードし、特定のディレクトリに解凍します:

https://jp.e-iceblue.com/download/spire-ocr-for-java.html

次に、IntelliJ IDEA で「ファイル」>「プロジェクト構造」>「モジュール」>「依存関係」に移動します。依存関係のペインで「+」ボタンをクリックし、「JARs または ディレクトリ」を選択します。Spire.OCR for Java が保存されているディレクトリに移動し、lib フォルダを開いて Spire.OCR.jar ファイルを選択し、OK をクリックしてプロジェクトの依存関係として追加します。

Java:画像からテキストを抽出する方法(OCR)

3. その他の依存ファイルをダウンロードして配置する

ご使用のオペレーティングシステムに適したモデルを以下のリンクからダウンロードしてください。

次に、パッケージを解凍し、コンピューターの特定のディレクトリに保存します。この例では、パッケージを「D:\」に保存しました。

Java:画像からテキストを抽出する方法(OCR)

Spire.OCR for Java を使用して画像からテキストを抽出する

以下は、Spire.OCR for Java を使用して画像からテキストを認識および抽出するためのコード例です:

  • Java
import com.spire.ocr.*;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;

public class Main {
    public static void main(String[] args) {
        try {
            // OcrScanner クラスのインスタンスを作成
            OcrScanner scanner = new OcrScanner();

            // スキャナー設定を行うために ConfigureOptions クラスのインスタンスを作成
            ConfigureOptions configureOptions = new ConfigureOptions();

            // 新しいモデルへのパスを設定
            configureOptions.setModelPath("D:\\win-x64");

            // テキスト認識の言語を設定。デフォルトは英語です。
            // サポートされている言語には、英語、中国語、繁体字中国語、フランス語、ドイツ語、日本語、韓国語があります。
            // English, Chinese, Chinesetraditional, French, German, Japanese, Korean
            configureOptions.setLanguage("Japanese");

            // スキャナーに設定オプションを適用
            scanner.ConfigureDependencies(configureOptions);

            // 画像からテキストを抽出
            scanner.scan("Sample.png");

            // 抽出したテキストをテキストファイルに保存
            saveTextToFile(scanner, "output.txt");

        } catch (OcrException e) {
            e.printStackTrace();
        }
    }

    private static void saveTextToFile(OcrScanner scanner, String filePath) {
        try {
            String text = scanner.getText().toString();
            try (BufferedWriter writer = new BufferedWriter(new FileWriter(filePath))) {
                writer.write(text);
            }
        } catch (IOException | OcrException e) {
            e.printStackTrace();
        }
    }
}

一時ライセンスを申請する

結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、についてこのメールアドレスはスパムボットから保護されています。閲覧するにはJavaScriptを有効にする必要があります。にお問い合わせ、30 日間有効な一時ライセンスを取得してください。

Published in Spire.OCR for Java
Tagged under