PDF ファイル形式は、デバイス間で文書の表示を一貫させることができます。しかし、PDF ドキュメントを Web ページに掲載する必要がある場合は、HTML ファイルに変換するのがよいでしょう。こうすることで、ファイルをダウンロードする必要がなく、ドキュメントのすべての内容を直接ブラウザで表示することができます。また、大きな PDF ドキュメントの読み込みには長い時間がかかりますが、HTML ファイルは非常に速くブラウザに表示させることができます。さらに、PDF ファイルに比べ、検索エンジンが HTML の Web ページをクロールして情報を取得することが容易であるため、Web サイトの露出が多くなります。本記事では、Spire.PDF for Java を使用して、Java で PDF ドキュメントを HTML ファイルに変換する方法を紹介します。
Spire.PDF for Java をインストールします
まず、Spire.PDF for Java を Java プロジェクトに追加する必要があります。JAR ファイルは、このリンクからダウンロードできます。Mavenを使用する場合は、次のコードをプロジェクトの pom.xml ファイルに追加する必要があります。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url> https://repo.e-iceblue.com/nexus/content/groups/public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf</artifactId>
<version>9.4.9</version>
</dependency>
</dependencies>
PDF ドキュメントを HTML ファイルに変換する
PDF ドキュメントから HTML ファイルへの変換は、Spire.PDF for Java が提供する PdfDocument.saveToFile(String filename, FileFormat.HTML) メソッドを使用して PDF ドキュメントを読み込み、HTML ファイルとして保存すれば直接行うことができます。詳細な手順は以下の通りです。
- PdfDocument のオブジェクトを作成します。
- PdfDocument.loadFromFile() メソッドを使用して、PDF ファイルを読み込みます。
- PdfDocument.saveToFle() メソッドを使用して、PDF ファイルを HTML ファイルとして保存します。
- Java
import com.spire.pdf.*;
public class convertPDFToHTML {
public static void main(String[] args) {
//PdfDocumentクラスのオブジェクトを作成する
PdfDocument pdf = new PdfDocument();
//PDFファイルを読み込む
pdf.loadFromFile("C:/自分を見失う.pdf");
//PDFファイルをHTMLファイルとして保存する
pdf.saveToFile("PDFからHTMLへの変換.html",FileFormat.HTML);
pdf.close();
}
}
PDF ドキュメントを SVG 埋め込み型の HTML ファイルに変換する
また、Spire.PDF for Java では、PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) メソッドで、変換時に SVG を埋め込むことができるようにしています。PDF ファイルを SVG を埋め込んだ HTML ファイルに変換するための詳しい手順は以下の通りです。
- PdfDocument のオブジェクトを作成します。
- PdfDocument.loadFromFile() メソッドを使用して、PDF ファイルを読み込みます。
- PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) メソッドを使用して SVG の埋め込みを有効にします。
- PdfDocument.saveToFle() メソッドを使用して、PDF ファイルを HTML ファイルとして保存します。
- Java
import com.spire.pdf.*;
public class convertPDFToHTMLEmbeddingSVG {
public static void main(String[] args) {
//PdfDocumentクラスのオブジェクトを作成する
PdfDocument doc = new PdfDocument();
//PDFファイルを読み込む
doc.loadFromFile("C:/自分を見失う.pdf");
//SVGの埋め込みを有効にする
doc.getConvertOptions().setPdfToHtmlOptions(true);
//PDFファイルをHTMLファイルとして保存する
doc.saveToFile("PDFからSVGを埋め込んだHTMLへの変換.html", FileFormat.HTML);
doc.close();
}
}
PDF ドキュメントを HTML ストリームに変換する
Spire.PDF for Java は、PDF ドキュメントを HTML ストリームに変換することもサポートしています。詳しい手順は以下の通りです。
- PdfDocument のオブジェクトを作成します。
- PdfDocument.loadFromFile() メソッドを使用して PDF ファイルを読み込みます。
- PdfDocument.saveToStream() メソッドを使用して、PDF ファイルを HTML ストリームとして保存します。
- Java
import com.spire.pdf.*;
import java.io.*;
public class convertPDFToHTMLStream {
public static void main(String[] args) throws FileNotFoundException {
//PdfDocumentクラスのオブジェクトを作成する
PdfDocument pdf = new PdfDocument();
//PDFファイルを読み込む
pdf.loadFromFile("C:/自分を見失う.pdf");
//PDFファイルをHTMLストリームとして保存する
File outFile = new File("PDFからHTMLストリームへの変換.html");
OutputStream outputStream = new FileOutputStream(outFile);
pdf.saveToStream(outputStream, FileFormat.HTML);
pdf.close();
}
}
一時ライセンスを申請する
結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、についてこのメールアドレスはスパムボットから保護されています。閲覧するにはJavaScriptを有効にする必要があります。にお問い合わせ、30 日間有効な一時ライセンスを取得してください。