毎日テキストマイニング

180日間、毎日テキストマイニングをするブログです

2018-07-24から1日間の記事一覧

2018/7/23【31日目】PythonでPDFからテキストを読み込む。その1

いろいろ調べ物をしていますと、PDFに当たることがあります。PDFを何かしらの分析に使えないかなーって思っていましたがpdfminer.sixというものを使えばテキスト出力ができるらしいので、今回触ってみました。 インストール 公式サイトはこちらです。 https:…