毎日テキストマイニング

180日間、毎日テキストマイニングをするブログです

2018-09-12から1日間の記事一覧

2018/09/09【78日目】会話データを(手動で)作っていく

昨日の段階で、ある程度kerasの仕組みはわかってきましたので、そろそろ本格的に手を動かしていきたいと思います。 その前に、いちおうtweetのデータ5265件を使ってテキスト生成はしてみました。3世代目でこんな感じです。temperature: 0.5がギリギリ良さげ…

2018/09/08【77日目】ソフトマックスの温度を調整してみる

ディープラーニング関連の話が続いて申し訳ないですが、今日もその続きです。 テキストを生成する際に、次に来る確率が一番高い単語を選ぶのが貪欲的サンプリング(greedy sampling)という。 ただし、毎回確率が高い単語だけを選んでいても、変わり映えがし…