PDF ドキュメントは、クロスプラットフォームでの互換性が高く、元のレイアウトや書式を保持できることから、情報共有の手段として広く利用されています。しかし、Web 技術の進化に伴い、Web サイトや各種オンラインプラットフォームに簡単に統合できるコンテンツへの需要が高まっています。このような背景から、PDF を HTML 形式に変換することの価値がますます高まっています。PDF ファイルをより柔軟でアクセスしやすい HTML に変換することで、ユーザーは Web 環境において PDF の情報をより効果的に活用、共有、再利用できるようになります。本記事では、Spire.PDF for .NET を使用して、C# で PDF ファイルを HTML 形式に変換する方法を紹介します。
Spire.PDF for .NET をインストールします
まず、Spire.PDF for .NET パッケージに含まれている DLL ファイルを、.NET プロジェクトの参照として追加する必要があります。これらの DLL ファイルは、このリンクからダウンロードするか、NuGet からインストールすることもできます。
PM> Install-Package Spire.PDF
PDF を HTML に変換する
PDF ドキュメントを HTML 形式に変換するには、Spire.PDF for .NET が提供する PdfDocument.SaveToFile(string fileName, FileFormat.HTML) メソッドを使用できます。具体的な手順は次のとおりです。
- PdfDocument クラスのインスタンスを作成します。
- PdfDocument.LoadFromFile(string fileName) メソッドを使用して PDF ドキュメントを読み込みます。
- PdfDocument.SaveToFile(string fileName, FileFormat.HTML) メソッドを使用して、PDF ドキュメントを HTML 形式として保存します。
using Spire.Pdf;
namespace ConvertPdfToHtml
{
internal class Program
{
static void Main(string[] args)
{
// PdfDocumentクラスのインスタンスを作成する
PdfDocument doc = new PdfDocument();
// PDF ドキュメントをロードする
doc.LoadFromFile("Sample.pdf");
// PDF ドキュメントを HTML 形式で保存する
doc.SaveToFile("PdfToHtml.html", FileFormat.HTML);
doc.Close();
}
}
}

PDF を HTML に変換する際の変換オプションを設定する
PdfConvertOptions.SetPdfToHtmlOptions() メソッドを使用すると、PDFファイルをHTMLに変換する際の変換オプションをカスタマイズできます。このメソッドには複数のパラメーターがあり、変換プロセスを設定するために使用できます。主なパラメーターは次のとおりです。
- useEmbeddedSvg (bool):生成される HTML ファイルに SVG を埋め込むかどうかを指定します。
- useEmbeddedImg (bool):生成される HTML ファイルに画像を埋め込むかどうかを指定します。このオプションは、useEmbeddedSvg が false に設定されている場合にのみ有効です。
- maxPageOneFile (int):1つの HTML ファイルに含めるページの最大数を指定します。このオプションは、useEmbeddedSvg が false に設定されている場合にのみ有効です。
- useHighQualityEmbeddedSvg (bool):生成される HTML ファイルで高品質の埋め込み SVG を使用するかどうかを指定します。このオプションは、useEmbeddedSvg が true に設定されている場合に有効です。
以下の手順では、Spire.PDF for .NET を使用して PDF を HTML に変換する際に、変換オプションをカスタマイズする方法を説明します。
- PdfDocument クラスのインスタンスを作成します。
- PdfDocument.LoadFromFile(string fileName) メソッドを使用して PDF ドキュメントを読み込みます。
- PdfDocument.ConvertOptions プロパティを使用して PdfConvertOptions オブジェクトを取得します。
- PdfConvertOptions.SetPdfToHtmlOptions(bool useEmbeddedSvg, bool useEmbeddedImg, int maxPageOneFile, bool useHighQualityEmbeddedSvg) メソッドを使用して、PDF から HTML への変換オプションを設定します。
- PdfDocument.SaveToFile(string fileName, FileFormat.HTML) メソッドを使用して、PDF ドキュメントを HTML 形式で保存します。
using Spire.Pdf;
namespace ConvertPdfToHtmlWithCustomOptions
{
internal class Program
{
static void Main(string[] args)
{
// PdfDocumentクラスのインスタンスを作成する
PdfDocument doc = new PdfDocument();
// PDF ドキュメントをロードする
doc.LoadFromFile("Sample.pdf");
// 変換オプションを設定して、結果の HTML に画像を埋め込み、HTML ファイルごとに 1 ページに制限します。
PdfConvertOptions pdfToHtmlOptions = doc.ConvertOptions;
pdfToHtmlOptions.SetPdfToHtmlOptions(false, true, 1);
// PDF ドキュメントを HTML 形式で保存する
doc.SaveToFile("PdfToHtmlWithCustomOptions.html", FileFormat.HTML);
doc.Close();
}
}
}
PDF を HTML ストリームに変換する
PDF ドキュメントを HTML ファイルとして保存する代わりに、PdfDocument.SaveToStream(Stream stream, FileFormat.HTML) メソッドを使用して、HTML ストリームとして保存することもできます。具体的な手順は次のとおりです。
- PdfDocument クラスのインスタンスを作成します。
- PdfDocument.LoadFromFile(string fileName) メソッドを使用して PDF ドキュメントを読み込みます。
- MemoryStream クラスのインスタンスを作成します。
- PdfDocument.SaveToStream(Stream stream, FileFormat.HTML) メソッドを使用して、PDF ドキュメントを HTML ストリームとして保存します。
using Spire.Pdf;
using System.IO;
namespace ConvertPdfToHtmlStream
{
internal class Program
{
static void Main(string[] args)
{
// PdfDocumentクラスのインスタンスを作成する
PdfDocument doc = new PdfDocument();
// PDF ドキュメントをロードする
doc.LoadFromFile("Sample.pdf");
// PDF ドキュメントをHTMLストリームに保存する
using (var fileStream = new MemoryStream())
{
doc.SaveToStream(fileStream, FileFormat.HTML);
// HTML ストリームを使ってファイルに書き込むなどの操作ができるようになりました。
using (var outputFile = new FileStream("PdfToHtmlStream.html", FileMode.Create))
{
fileStream.Seek(0, SeekOrigin.Begin);
fileStream.CopyTo(outputFile);
}
}
doc.Close();
}
}
}
一時ライセンスを申請する
結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、について営業担当者 にお問い合わせ、30 日間有効な一時ライセンスを取得してください。






