« [置換]Macのファイル名フォルダ名用の置換(Mac専用windwsとの互換は配慮しないタイプ) | トップページ | [pypdf] PDFのドキュメント内 リンクオブジェクトを収集する »

[pypdf] PDFのドキュメント内 リンクオブジェクトを収集する

ダウンロード - pdf2getlink.zip


#! /usr/bin/env python3
# coding: utf-8
import sys
from pypdf import PdfReader

file_path = sys.argv[1]
#file_path = "/some/dir/koko-ha/fullpath-ne/Desktop/調べたい.pdf"

app_PdfReader = PdfReader(file_path)
for itemPage in app_PdfReader.pages:
    if "/Annots" in itemPage:
        for annotArray in itemPage["/Annots"]:
subtype = annotArray.get_object()["/Subtype"]
if subtype == "/Link":
dict_Annot = (annotArray.get_object())
# print(dict_Annot)
if "/A" in dict_Annot:
# print(annotArray.get_object()["/A"])
dict_A = (annotArray.get_object()["/A"])
if "/D" in dict_A:
print(dict_A.get_object()["/D"])
elif "/URI" in dict_A:
print(dict_A.get_object()["/URI"])

# if "/Dest" in dict_Annot:
# print(annotArray.get_object()["/Dest"])
# obj_dist = annotArray.get_object()["/Dest"]
# print(obj_dist["target_page_index"])
# Dest関連はエラーになるので仕様通りに動作しない

sys.exit(0)


|

« [置換]Macのファイル名フォルダ名用の置換(Mac専用windwsとの互換は配慮しないタイプ) | トップページ | [pypdf] PDFのドキュメント内 リンクオブジェクトを収集する »

AppleScript PDF」カテゴリの記事