5日と20日は歌詞と遊ぼう。

歌詞を読み、統計したりしています。

いつの時代の曲がいちばん狩歌が盛り上がるか、5341曲を調べた結論!

こんにちは!

狩歌というカードゲームがあります。

歌詞を読み札にして、場札を取るカルタみたいなやつです。

f:id:hacosato:20170423223416j:plain

カードはこういう感じ。J-POPの歌詞に出てくる言葉なんてどれもだいたいいっしょじゃん!というツッコミを逆手に取ったカードゲーム、めっちゃ楽しいから流行ってくれ!!

ところで、この感じから容易に想像できるように、このゲームはどんな曲をかけるかによって、カードがさばけるテンポがまったく変わってきます。

例えば頻出単語の多い曲だと激しい点取合戦。GLAY「HOWEVER」をかけてみたら(中略)もう1番だけで札ワードの嵐。甘いミディアムバラードに反して机を叩く音が連発するハイスコアゲームとなった。
 
一方で頻出単語がたった3、4回ほどしか出てこない曲は、数少ない単語に耳をすませるピリピリしたゲームに。ASIAN KUNG-FU GENERATION「リライト」のときは3回しか登場せず、みんなでじっと札を見つめる時間が続く。しびれを切らして「ゴッチ(※作詞したボーカル後藤正文)まだなの!? まだなの!?」と叫ぶシュールな勝負となった。
http://nlab.itmedia.co.jp/nl/articles/1701/03/news019.html

(↑この記事、狩歌の楽しさがコンパクトにわかるプロの記事って感じなのでぜひみてほしい!!)

やってみるとわかるんですが、そりゃもちろん、じりじり札を見つめるよりも、ばんばんカードが減っていくほうが盛り上がるのです。

でもどんな曲を選んだら盛り上がるの??

というわけで、狩歌に向いた選曲をするため、わたしは戦後のヒット曲をすべて辿る旅に出たのでした。


今回は、どの年代の曲が最も狩歌に向いているかを調べ、いちばんカードがたくさん減る年代を選定しよう!という趣旨で調査してみます。
手順は以下の通りです。

  1. 年代ごとにヒット曲をまとめる
  2. 対象になる曲の歌詞を調べる
  3. それぞれの歌詞の狩歌スコアを算出
  4. 年代ごとの狩歌スコアをグラフにする

という4つのステップを踏みたいと思います。
狩歌スコアとは、それぞれの曲に付与するスコアで、曲に含まれる狩歌の札をすべてひとりの人が取ったときの点数です。

ではスタート!

年代ごとのヒット曲!

entamedata.web.fc2.com
ランキングはPRiVATE LiFEのものを使いました*1
このチャートでは、1945年から1949年までがひとつにまとまっていて、それ以外は2017年まで1年ごとのデータがありました。これをすべて対象としましょう。
今回は5341曲を得ました。
中途半端な数に見えるのは、2001年のチャートに同率100位があり、101曲がランクインしているからです。

このデータをSQLiteに放り込みました。データベース人生で初めて使っています。どきどき。

対象になる曲の歌詞を調べる!

次に、この5341曲について、歌詞を探そうと思います。
今回はいつも活用させていただいている歌ネットで検索しました。
www.uta-net.com
今回は古い曲も多いので、うたまっぷのほうがいいかもしれないなとあとから思いました。比較実験はやれたらやってみます。
hacosato.hatenablog.com
↑歌詞サイトの比較は前にやったことがある♪

ところがやはり名寄せが甘かったり、なかなかヒットしない曲も多くてですね…。
今回、歌ネットから歌詞を取得できた割合は、年ごとに以下の通りでした。

f:id:hacosato:20170806130141p:plain

80年代から90年代の取得率がすこし低め。

全体では0.75でした。4曲中3曲の歌詞がわかっていて、4曲中1曲の歌詞が取得できていないということです。ゆゆしき問題!!

大きな影響があるところは手作業で名寄せしてみたんですが*2、ほとんどやってないに等しいです。中途半端ならしないほうがいいぐらいなのに雑でごめんなさい……。

どちらにしてもこのデータを元にしていろいろと遊べるはずなので、今後手作業でこつこつ名寄せしていこうと思います。

それぞれの曲の狩歌スコアを算出!

さらに、それぞれの曲について狩歌のスコアを算出します。

狩歌では、カードごとに得点が決まっていて、頻出の単語は低い点数、そうでない単語(といってもJ-POPの中ではとてもよく出てくる)は高い点数が出るようになっています。

さらに私の手元にある基本セット(No.1)では、

  • ダブルポイント(同じ曲の中で同じカードの歌詞が2回以上出てきたときに得点が2倍)
  • 逆転カード(1点カードを3枚集めるとプラス10点)

というルールがあるのでそれを反映させます。

本来のルールであれば100枚あるカードのうち1ラウンドで50枚しか使わないルールなのですが、たくさんカードが動くほうが楽しいのでわたしはいつもぜんぶ使っています。今回もぜんぶのカードを対象にするように得点を算出しました。

算出にはPythonを使いました。

年代ごとの狩歌スコアをグラフにする

最後にそれをビジュアライズしてみました! こうなった!

f:id:hacosato:20170806141329p:plain

つまり、年代でいうなら2009年の曲を選出することによって大変盛り上がるということが示唆されました。すごい。

ちなみに2009年の年間オリコンチャートトップ10はこういう感じです。

アーティスト タイトル
Believe
明日の記憶
マイガール
秋元順子 愛のままで…
Everything
B'z イチブトゼンブ
KAT-TUN RESCUE
遊助 ひまわり
KAT-TUN ONE DROP
関ジャニ∞ 急☆上☆Show!!

嵐無双かよ!!

Wikipedia2009年の音楽とか見てると一日が終わりますね。

グラフの中の上下の黒い線は株でいうところのボリンジャーバンドです。σ±1で線を引いてみて分散具合を見てみようと思ったけど、あんまりおもしろいことなかった感。平均が増えると標準偏差増えるの当たり前だよね??

ところで、この中だと、狩歌スコアが高い曲はどれなんでしょうか?

リストを並べ替えるだけで済むのでやってみたらこうなりました!

アーティスト タイトル 狩歌スコア
GLAY SAY YOUR DREAM 142
いきものがかり 風が吹いている 140
コブクロ 君という名の翼 137
マイガール 136
いきものがかり YELL 135
globe Sa Yo Na Ra 134
広瀬香美 promise 127
globe wanna Be A Dreammaker 127
防弾少年団 FOR YOU 125
SMAP ありがとう 125

だだだだだ!!!(ひざを連打する音)

めっちゃわかりますね。このJ-POPあるある感。



というわけで、いつの時代の曲がいちばん狩歌盛り上がるか、5341曲を調べた結論!でした。

実はこの結論にはいろいろと問題がありまして、中でも歌詞を取得できてない曲が結構たくさんあるのが問題としてでかい感じがします…。

わたしの感じからすると、それぞれの年代で、歌詞が調べきれていない理由には違いがあって、

  • 80年代まで:古くて歌ネットに登録されていない
  • 90年代から00年代:表記にゆれがあり、検索がヒットしない
  • 00年代から17年:アニソン、K-POPが多くて歌ネットに登録されてない

という事情がある感じがします。表記を凝るのはたとえばビジュアル系に多い感じがするし、アニソンには特有の歌詞のくせがあるからそれをとりこぼしてしまうし、
要は年代ごとの違いを調べようとしているのに、ジャンルの特徴に足下をすくわれて、調べたいことが調べきれていない!
っていうのをすごく感じます。でもこつこつ名寄せするの大変なんだよう…。また今度やってみるね。

あと、狩歌をするなら当然どのアーティストの曲が盛り上がるの?って疑問が頭に浮かぶはずで、それに答えられてないのもまだ不満なので、今後はそのあたりを改善していけるようにがんばります!!💪

hacosato.hatenablog.com

とりまみんなもっと狩歌やろうぜ!!

*1:でも実はこのデータ、出典がよくわかりません。近年のものはオリコンチャートと合致するので間違いないのですが、オリコンチャートは1968年からしかないはずなのに、PRiVATE LiFEには戦後すぐのものから存在するため、古いものはなにか別のチャートと混ぜているのかもしれません…。サイトには「各データは資料に基づいていますが、個人で調べたもので公式データではありません」とあります。

*2:特に「三代目 J Soul Brothers」は日本語と英語の間に半角スペースを入れる派と入れない派があってしんどい…