Word 文書には、タイトル、作成者、件名、キーワードなどの情報を含むメタデータとして「ドキュメントプロパティ」が存在します。これらのプロパティを適切に管理することで、文書の整理、検索性の向上、共同作業における適切な情報付与が可能になります。Spire.Doc for Python を使用すると、Word 文書のドキュメントプロパティを自動的に追加、読み取り、削除でき、ドキュメント管理のワークフローを効率化し、より大規模な自動化システムとの統合を容易にします。本記事では、Spire.Doc for Python を用いたドキュメントプロパティの管理方法について、具体的な手順とコード例を交えて解説します。 Python で Word 文書に組み込みプロパティを追加する Python で Word 文書の組み込みプロパティを読み取る Python で Word 文書の組み込みプロパティを削除する Spire.Doc for Python のインストール この操作には、Spire.Doc for Python と plum-dispatch v1.7.4 が必要です。これらは、Spire.Doc for Python の公式ウェブサイトから手動でダウンロードするか、以下の pip コマンドでインストールできます。 pip install Spire.Doc Python で Word 文書に組み込みプロパティを追加する Spire.Doc for Python では、Document.BuiltinDocumentProperties プロパティを使用して、Word 文書の組み込みプロパティにアクセスできます。これらのプロパティの値は、BuiltinDocumentProperties クラスの対応するプロパティを設定することで変更可能です。 以下の手順で、Word 文書の主要な組み込みプロパティを追加できます。 Document クラスのオブジェクトを作成します。 Document.LoadFromFile() メソッドで Word 文書を読み込みます。 Document.BuiltinDocumentProperties プロパティで組み込みプロパティを取得します。 BuiltinDocumentProperties クラスのプロパティを設定して値を追加します。 Document.SaveToFile() メソッドで文書を保存します。 Python from spire.doc import Document # Documentオブジェクトの作成 doc = Document() # Word文書の読み込み doc.LoadFromFile("Sample.docx") # 組み込みプロパティの設定 builtinProperty = doc.BuiltinDocumentProperties builtinProperty.Title = "人工知能の革命" builtinProperty.Subject = "人工知能におけるニューラルネットワークの高度な応用と未来の方向性" builtinProperty.Author = "サイモン" builtinProperty.Manager = "アリエ" builtinProperty.Company = "AIリサーチラボ" builtinProperty.Category = "研究" builtinProperty.Keywords = "機械学習、ニューラルネットワーク、人工知能" builtinProperty.Comments = "この論文は人工知能の最前線に関するものです。" builtinProperty.HyperLinkBase = "www.e-iceblue.com" # 文書の保存 doc.SaveToFile("output/プロパティの追加.docx") doc.Close() Word 文書の組み込みドキュメントプロパティを読み取る BuiltinDocumentProperties クラスのプロパティを利用すると、Word 文書に既に設定されている組み込みプロパティを読み取ることができます。これにより、ドキュメントの検索、情報抽出、文書分析などの機能を実装可能です。 以下の手順で、Word 文書の組み込みプロパティを取得できます。 Document クラスのオブジェクトを作成します。 Document.LoadFromFile() メソッドで Word 文書を読み込みます。 Document.BuiltinDocumentProperties プロパティで組み込みプロパティを取得します。 BuiltinDocumentProperties クラスのプロパティで値を取得します。 プロパティを出力します。 Python from spire.doc import Document # Documentオブジェクトの作成 doc = Document() # Word文書の読み込み doc.LoadFromFile("output/プロパティの追加.docx") # 文書の組み込みプロパティを取得 builtinProperties = doc.BuiltinDocumentProperties # 組み込みプロパティの値を取得 properties = [ "作成者: " + builtinProperties.Author, "会社: " + builtinProperties.Company, "タイトル: " + builtinProperties.Title, "件名: " + builtinProperties.Subject, "キーワード: " + builtinProperties.Keywords, "カテゴリ: " + builtinProperties.Category, "管理者: " + builtinProperties.Manager, "コメント: " + builtinProperties.Comments, "ハイパーリンクベース: " + builtinProperties.HyperLinkBase, "単語数: " + str(builtinProperties.WordCount), "ページ数: " + str(builtinProperties.PageCount), ] # 組み込みプロパティを出力 for i in range(0, len(properties)): print(properties[i]) doc.Close() Python で Word 文書の組み込みプロパティを削除する Word 文書の組み込みドキュメントプロパティの中で特定の内容を持つものは、値を None に設定することで削除できます。これにより、不要な情報を削除しながら、必要なデータを保持することが可能になります。 以下の手順で、Word 文書の特定の組み込みプロパティを削除できます。 Document クラスのオブジェクトを作成します。 Document.LoadFromFile() メソッドで Word 文書を読み込みます。 Document.BuiltinDocumentProperties プロパティで組み込みプロパティを取得します。 BuiltinDocumentProperties クラスのプロパティの値を None に設定して削除します。 Document.SaveToFile() メソッドで文書を保存します。 Python from spire.doc import Document # Documentクラスのインスタンスを作成 doc = Document() # Word文書を読み込む doc.LoadFromFile("output/プロパティの追加.docx") # 文書の組み込みプロパティを取得 builtinProperties = doc.BuiltinDocumentProperties # 組み込みプロパティを削除(Noneを設定) builtinProperties.Author = None builtinProperties.Company = None builtinProperties.Title = None builtinProperties.Subject = None builtinProperties.Keywords = None builtinProperties.Comments = None builtinProperties.Category = None builtinProperties.Manager = None # 文書を保存 doc.SaveToFile("output/プロパティの削除.docx") doc.Close() 一時ライセンスを申請する 結果ドキュメントから評価メッセージを削除したい場合、または機能制限を取り除く場合は、についてこのメールアドレスはスパムボットから保護されています。閲覧するにはJavaScriptを有効にする必要があります。 にお問い合わせ、30 日間有効な一時ライセンスを取得してください。