180日間Webサービスを作り続けた記事を読んで感銘を受けたので、自分も何かやりたいな、と思っていました。
- できるだけやったことがない分野で、
- 180日間やっていける関心が強くて、
- ネタ切れにならず将来役に立つもの
という条件で考えていたのですが、テキスト分析がちょうどやりたったのでこれをやることにします。今ならTwitterやWebでいくらでもテキストを集められますし、180日間分析したら機械学習に応用できそうな良いスキルが身につきそうです。どうせならPVを一番集められそうな乃木坂メンバーの呟きを分析しようと思ったのですが、乃木坂のメンバーってTwitterやってないんですね。AKBで探したら45名ほど見つかりましたので、ひとまずAKBのメンバーの呟きを分析することにします。
ターゲット
Twitterのアカウントを見つけたのは次のメンバーです。 2018年度の総選挙の順位もつけています。
- 浅井七海 @48_asainanami
- 市川愛美 @IckwMnm0826
- 入山杏奈 @iriyamaanna1203
- 22位:岩立沙穂 @yahho_sahho
- 大川莉央 @rio_rin48
- 88位:大森美優 @omorimyu_pon
- 100位:大家志津香 @ooyachaaan1228
- 5位:岡田奈々 @okadanana_1107
- 36位:加藤玲奈 @katorena_710
- 41位:川本紗矢 @sayaya_0388
- 北澤早紀 @Sakii_Kitazawa
- 75位:久保怜音 @AKB48K5
- 19位:小嶋真子 @mak0_k0jima
- 65位:後藤萌咲 @moe_goto0520
- 52位:込山榛香 @912_komiharu
- 44位:佐々木優佳里 @yukari__0828
- 佐藤妃星 @ki_cyaco48
- 94位:篠崎彩奈 @ayana18_48
- 下口ひなな @177__shimo719
- 鈴木くるみ @akb48kururun
- 12位:高橋朱里 @juri_t_official
- 田北香世子 @kayoyon213
- 田口愛佳 @48manaka_16
- 竹内美宥 @take_miyu112
- 達家真姫宝 @makiho_1019
- 33位:谷口めぐ @o_megu1112
- 千葉恵里 @erii_20031027
- 中西智代梨 @chiyori_n512
- 西川怜 @rei_1025_48
- 野澤玲奈 @RENAN0ZAWA
- 樋渡結依 @yui_hiwata430
- 31位:福岡聖菜 @seina_fuku48
- 藤田奈那 @fujitanana_1228
- 97位:馬嘉伶 @macyacyarin
- 前田彩佳 @akb4816ayaka
- 32位:峯岸みなみ @chan__31
- 宮崎美穂 @730myao
- 13位:向井地美音 @mionnn_48
- 武藤小麟 @muto_orin
- 7位:武藤十夢 @tommuto1125
- 村山彩希 @yuirii_murayama
- 茂木忍 @mogi0_0216
- 92位:山内瑞葵 @MizukiYamauchi
- 山邊歩夢 @ayuchan0203
- 湯本亜美 @ami_15chans
- 6位:横山由依 @Yui_yoko1208
実践
Pythonで適当なコードを書いて、テキストを取得しようとしたのですが、どうもparamsに複数のアカウントを指定する方法がわからない。仕方ないので、人数分のスクリプトを書きました。ここで初めてシェルスクリプトを学んだのですが、これ便利ですね。
参考:pythonファイルを自動で実行
(https://qiita.com/yuukiclass/items/53da5b284d695c5a5461)
とりあえず、初日から頑張り過ぎても続かないので、今回はここまで得たテキストをUSER LOCALさんの提供しているサービスに投入して終わります。
結果
- 本日AKBのメンバーが投稿した数は35件でした。
- 頻出単語は
- ありがとう,5
- ROOM,5
- AKB48,5
- 総選挙,5
- 今回,5
- ラジオ,5
でした。
今回身につけた知識
shでのスクリプトを自動で実行する操作