毎日テキストマイニング

180日間、毎日テキストマイニングをするブログです

毎日テキストマイニングをサボってやっていたこと

久しぶりの更新になってしまいました。

180日間続けるといいつつ、半分の92日間しか継続できませんでした。しかし、毎日テキストマイニングをサボっている間、プログラミングをサボっていたわけではありません。毎日テキストマイニングを通して学習した深層学習で画像の色付けをしていました。

その成果としてサイトを作りました。

color-learning.com

kerasを使って白黒写真を色付けしたものを紹介していくだけのサイトです。 綺麗に色がつくかはPhotoshopの前処理にかかっているという程度の技術力です。

例としてはこんな感じです。この写真は太宰治が銀座のルパンというバー坂口安吾と対談している時の写真です。

f:id:rimt:20181018002411p:plain

元はこんな感じでした。

f:id:rimt:20181018002618j:plain

なぜこのようなことを始めたかと言いますと、今年の8月15日に、終戦から1年が経った広島の写真を深層学習でカラー化した写真が公開され、その写真にひどく感銘を受けたからです。戦争は主に白黒写真でしか見たことがなかったですし、かなり昔に行われていた前世代のものという感覚がありました。しかし、カラー化された写真を見ることで、つい最近まで行われていたものなんだと認識できました。物事の背景には全て歴史がある、と言いますが、この感覚をもっと知りたくて白黒写真のカラー化はやりたいことの1つでした。

そして、深層学習と言いましても、毎日テキストマイニングを通してPythonの基礎はできていましたので、割と楽に実装できました。むしろ自然言語処理と比べて画像処置はかなり楽でした。

90日間しか継続できませんでしたが、やはり毎日インプット・アウトプットを繰り返していくと(苦しいですが)上達は早かったです。この企画を始めてなかったら、深層学習なんて夢のまた夢でしたし、GPU入りのパソコンなんて買わなかったですのでとてもよかったと思います。

しかし、180日間やると言ってできなかったのは反省すべき点です。継続できなかった理由は以下の点かと。。。

  • 毎日のネタが思いつかなかった。
  • 仕事の忙しさの波が激しかった。
  • たまにある飲み会が断れなかった
  • マイニング・自然言語処理がやや難しすぎた
  • 80日目くらいで心が折れまくってた(このブログを開くのもトラウマw)
  • 土日も休めないのが辛い。

毎日のネタ探しが一番辛かったですね。今日の分を書けても、その場で次の日の分のネタを考えなきゃいけないのは地獄でした。次に180日間チャレンジをやるときはネタに困らないテーマでやりたいですね。ひとまず土日は休みつつ、白黒写真をカラー化していきたいと思います。こちらもどうぞよろしくお願いいたします。

最後に宣伝ですが、日露戦争の写真集をカラー化してkindleに置いていますので、興味がある方は見ていただければ幸いです。10月21日(日)まで無料で配信しています。

ディープラーニングで蘇る カラー版 日露戦争写真集

https://www.amazon.co.jp/dp/B07JVCJN4V/ref=cm_sw_r_tw_dp_U_x_fm1XBb8FZYVGV