毎日テキストマイニング

180日間、毎日テキストマイニングをするブログです

2018/09/03【72日目】結局LSTMがよくわからないので、日本語の本を読んでいく

昨日のコードを40世代まで実行していましたら、下記のようになりました。

Epoch 40. Loss: 2.09404529274
こんにち を し た   今日 は 握手会 ありがとう ござい まし た ? 今日 は 1 日 で は、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、

まだ途中ですが、AKBが呟きそうなことを生成してますね。 LSTMすごいなーと思いつつも何をやっているのかわからないので、本を読んで勉強したいと思います。 しかし、日本語の体系付いた本で学ぶとなると、kerasに頼らざるを得ないですね。脱線しまくっていますが、結局TensolFlowとKerasで進めていきたいと思います。

ちなみに読んでいく本はこちらです。

f:id:rimt:20180907000934j:plain

1章を座学したのですが、とりあえず、何もコードを書かずに終わるのもあれなので、importと文字の摘出だけでもやっておきたいと思います。

import numpy as np
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import LSTM, Dropout, Dense

file = "all_kaiseki.txt"
text = open(file).read()
text = text.lower()

character_list = sorted(list(set(text)))
print(character_list)

今日の結果

今日のAKBの呟きは60件でした。 要約するとこんな感じでした。

5 年 連続 で ステファイ 選抜 に 入れる の も すごい こと な のに 私 が 「 1 位 に なり たい ! 」 なんて 言っ た から 大変 でし た よ ね (;▽;) それなのに 叶え て いただけ て 、 、 もう 感謝 しか あり ませ ん ✨ さ ほり ん ず 最高 ! 本 … " "# チーム B 公演 の 初日 に 出演 できる こと に なり  た ?
# RESET 公演 " " 9 位 ! !!!!!!!! 長い 間 沢山 の 応援 本当に ありがとう ござい  た ?!! 最後 の ステファイ 選抜 全力 で 楽しみ  ?!!!!!! " " 13 位 ! ! 嬉しい ! ! ! ! 頑張っ て くださっ た 皆さん 本当に ありがとう ござい  ?✨ " " 愛美 さん の 生誕 祭 終わり  た ?
" この あと 21 時半 〜 SHOWROOM し  \ (^ o ^)/ そろそろ キャッチフレーズ 決め ない と ぜひ み て ご 意見 お まち し て  ✨ # せい ROOM " "# ステファイ 最後 の センター 争奪 バトル ✨ 第 7 位 ✨ 本当に ありがとう ござい  ! ! この 順位 を 胸 に 最後 の ステージ 大切 に 踊る ぞ ー " " おはよう ござい  ! チーム B シアター の 女神 公演 初日 メンバー に 選ん で いただき  た ✨ 何 度 たっ て も 特別 な 初日 。 最高 の 日 に できる よう に 精一杯 練習 頑張り  ! ! 9 月 8 日 ぜひ み に き て 下さい \ (^ o ^)/ " " 歌 収録 2 つと 取材 し て き  た ー ! なお さん の ショート ヘア 激 可愛い ?
'嬉しい': 9, 'ない': 6, '可愛い': 5, 'すごい': 3, '美味しい': 2, '凄い': 2, '長い': 2, '楽しい': 2, '面白い': 1, 'ありがたい': 1, '優しい': 1, 'かわいい': 1, 'よろしい': 1
'位': 12, '公演': 12, '今日': 12, 'さん': 12, '初日': 11, '笑': 11, '生誕': 10, '愛美': 10, '嬉しい': 9, '祭': 9, '皆さん': 9, 'よう': 8, '最高': 7, 'さ': 7, 'チーム': 7, 'センチメンタルトレイン': 7, 'ない': 6, 'こと': 6, 'お願い': 6, 'ん': 6, '収録': 6, '可愛い': 5, '年': 5, '選抜': 5, '私': 5, '出演': 5, '応援': 5, 'みんな': 5, '日': 5, 
'する': 33, '位': 12, '公演': 12, '今日': 12, 'さん': 12, '初日': 11, '笑': 11, 'てる': 11, '生誕': 10, '愛美': 10, 'くださる': 10, '見る': 10, 'なる': 10, '嬉しい': 9, '祭': 9, '皆さん': 9, 'よう': 8, '最高': 7, 'さ': 7, 'チーム': 7, 'センチメンタルトレイン': 7, 'くる': 7, 'ない': 6, 'こと': 6, 'お願い': 6, 'ん': 6, '収録': 6, 'ある': 6, '頑張る': 6, '可愛い': 5, '年': 5, '選抜': 5, '私': 5, '出演': 5, '応援': 5, 'みんな': 5, '日': 5, 

f:id:rimt:20180906235859p:plain

それと、KH corderを再ダウンロードしましたら復活しました。今回は何もエラーが起こらずスムーズに描写ができました。よかったです。 f:id:rimt:20180907000251p:plain