PDF, EXCEL, WORD 全文検索ツール

フリーウェア

各種バイナリ文章全文検索ツール

拡張子.pdf, .xls, .doc などの各種バイナリ文章ファイルからテキストを抽出し、全文検索できるツールを作りました。

スクリーンショット

ダウンロード

ダウンロード(Github)

対応拡張子

対応の拡張子は以下の通りです。

拡張子ファイル種類
.rtfリッチテキスト
.docxMicrosoft WORD 2007/2010/2013(OOXML)
.xlsxMicrosoft Excel 2007/2010/2013(OOXML)
.pptxMicrosoft PowerPoint 2007/2010/2013(OOXML)
.docMicrosoft WORD ver5.0/95/97/2000/XP/2003
.xlsMicrosoft Excel ver5.0/95/97/2000/XP/2003
.pptMicrosoft PowerPoint 97/2000/XP/2003
.sxw/.sxc/.sxi/.sxdOpenOffice.org
.odt/.ods/.odp/.odgOpen Document
.jaw/jtw一太郎 ver5
.jbw/juw一太郎 ver6
.jfw/jvw一太郎 ver7
.jtd/jtt一太郎 ver8/9/10/11/12
.oas/oa2/oa3OASYS/Win
.bun新松/松5/松6
.wj2/wj3/wk3/wk4/123Lotus 123
.wriWindows3.1 Write
.pdfAdobe PDF
.mht/mhtmlWebアーカイブ
.htmlHTML
.emlOutlookExpressのエクスポート形式

ソースコード

こちらのツールはオープンソースであり、どなたでも自由に改変・再配布可能です。ソースコードは以下にあります。

謝辞

このツールのテキストの抽出には http://ebstudio.info/home/xdoc2txt.html を使用させていただいております。

コメント

タイトルとURLをコピーしました