HTML ファイルには、テーブル内に貴重なデータセットが埋め込まれていることがよくあります。しかし、HTML 形式で直接データを分析するのは手間がかかり、効率的ではありません。HTML テーブルを Excel 形式に変換することで、Excel の強力なデータ操作および分析ツールを活用し、データの並べ替えやフィルタリング、視覚化を簡単に行えるようになります。レポート作成のためのデータ分析、計算の実行、またはデータをより使いやすい形式で整理するためにも、HTML から Excel への変換は非常に便利です。本記事では、Java で Spire.XLS for Java を用いた HTML ファイルの Excel 形式への変換方法をご紹介します。
Spire.XLS for Java をインストールします
まず、Spire. XLS for Java を Java プロジェクトに追加する必要があります。JAR ファイルは、このリンクからダウンロードできます。Maven を使用する場合は、次のコードをプロジェクトの pom.xml ファイルに追加する必要があります。
<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url> https://repo.e-iceblue.com/nexus/content/groups/public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.xls</artifactId>
<version>14.12.0</version>
</dependency>
</dependencies>
Java で HTML を Excel に変換する
Spire.XLS for Java は、HTMLファイルを読み込むための Workbook.loadFromHtml() メソッドを提供しています。このメソッドで HTML ファイルをロードした後、Workbook.saveToFile() メソッドを使用して Excel 形式に変換できます。手順は以下の通りです。
- Workbook クラスのオブジェクトを作成します。
- Workbook.loadFromHtml() メソッドを使用して HTML ファイルを読み込みます。
- Workbook.saveToFile() メソッドを使用して HTML ファイルを Excel 形式で保存します。
- Java
import com.spire.xls.ExcelVersion;
import com.spire.xls.Workbook;
public class HTMLToExcel {
public static void main(String[] args) {
// 入力する HTML ファイルのパスを指定
String filePath = "Sample.html";
// ワークブッククラスのオブジェクトを作成
Workbook workbook = new Workbook();
// HTML ファイルを読み込む
workbook.loadFromHtml(filePath);
// HTML ファイルを Excel XLSX 形式で保存
String result = "output/HTMLをExcelに変換.xlsx";
workbook.saveToFile(result, ExcelVersion.Version2016);
// リソースを解放
workbook.dispose();
}
}
Java で HTML 文字列を Excel に挿入する
HTML ファイルを Excel に変換するだけでなく、Spire.XLS for Java を使用すると、HTML 文字列を直接 Excel のセルに挿入することも可能です。この機能は、CellRange.setHtmlString() メソッドを利用して実現します。手順は以下の通りです。
- Workbook クラスのオブジェクトを作成します。
- Workbook.getWorksheets().get(index) メソッドを使用して、特定のインデックス(0 ベース)のワークシートを取得します。
- Worksheet.getCellRange() メソッドを使用して、HTML 文字列を挿入したいセルを取得します。
- CellRange.setHtmlString() メソッドを使用して、セルに HTML 文字列を挿入します。
- Workbook.saveToFile() メソッドを使用して、生成されたワークブックを新しいファイルに保存します。
- Java
import com.spire.xls.CellRange;
import com.spire.xls.ExcelVersion;
import com.spire.xls.Workbook;
import com.spire.xls.Worksheet;
public class InsertHTMLStringToExcel {
public static void main(String[] args) {
// ワークブッククラスのオブジェクトを作成
Workbook workbook = new Workbook();
// 最初のシートを取得
Worksheet sheet = workbook.getWorksheets().get(0);
// HTML文字列を指定
String htmlCode = "これは 段落 で、赤色のテキストがあります。
";
// HTML文字列を追加するセルを取得
CellRange range = sheet.getCellRange("A1");
// セルにHTML文字列を追加
range.setHtmlString(htmlCode);
// コンテンツに基づいて最初の列の幅を自動調整
sheet.autoFitColumn(1);
// 結果のワークブックを新しいファイルに保存
String result = "output/HTML文字列をExcelに挿入.xlsx";
workbook.saveToFile(result, ExcelVersion.Version2013);
// リソースを解放
workbook.dispose();
}
}
一時ライセンスを申請する
結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、についてこのメールアドレスはスパムボットから保護されています。閲覧するにはJavaScriptを有効にする必要があります。にお問い合わせ、30 日間有効な一時ライセンスを取得してください。