本を読む

読書やコンピュータなどに関するメモ

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

pdfgrepでPDFをgrepする

 タイトルで出オチのような気もしますが、LinuxにはPDFファイルをgrepするpdfgrepというコマンドがあります。UbuntuやFedora、Debianなどでは標準リポジトリからインストールできます。

$ sudo apt-get install pdfgrep

 正規表現はPOSIX拡張正規表現です。-Hオプションでファイル名が、-nオプションで該当するページ番号が付きます。

$ pdfgrep -Hn --color auto 'Dash|ダッシュ' *.pdf
UM06_P008-010.pdf:2: ダッシュして
UM06_P011-033.pdf:8: Dashホーム
UM06_P011-033.pdf:8: と、Dashがデスクトップ上にオー
UM06_P011-033.pdf:8: バーレイ表示される。DashはWi
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:3: をDashで検索
UM06_P072-085.pdf:11: Dashを起動する
UM06_P072-085.pdf:11: LauncherとDashの操作

 PDF形式の文書の検索や、雑誌や書籍のPDF校正などに便利ではないかと思います。ちなみにPDFの解釈には、CUPSやxpdfなどでも利用されているpopplerが使われているようです。

コメント

コメントの投稿

管理者にだけ表示を許可する

トラックバック

http://emasaka.blog65.fc2.com/tb.php/1010-262bf69c

 | HOME | 

Categories

Recent Entries

Recent Comments

Recent Trackbacks

Appendix

emasaka

emasaka

フリーター。
連絡先はこのへん

Monthly


FC2Ad

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。