こんにちは!
先々週ぐらいになりますが、Twitterで #衝撃を受けたスピッツの歌詞 というハッシュタグがトレンドに入りました。
そのあとも続々と、 #衝撃を受けた特撮・アニソンの歌詞 #衝撃を受けたサカナクションの歌詞 とかがたくさん拡散していました✨
今回はその中から、 #衝撃を受けたBUMPの歌詞 を集計してみました!
そしてどの曲が一番人気か、さぐってみようと思ったのでした。
わたしが思っていたあれは3位で、人気はなさそうだけどこれ好きだなと思っていたあれは1位でした。
お楽しみは、スクロールの先で!
まずは、収集する。
というわけで、まずはツイートを収集します。
TwitterのAPIはわりとさくっと仕様が変わるイメージだけど、下記のブログをほぼもとにして、2019年でもうまくいきました!
Qiitaとsartan123さんありがたい…🙏
ID含めてSQLiteのデータベースにぶち込みました。マジで上記記事とかわるところがほとんどないのでコードは省略。
これでツイートを1000コ集めました。氷山の一角です。
つぎに分析する。
つぎに、ツイートごとに、各ツイがどの曲に言及しているのかを調べます。
ここで最近流行りの深層学習だ!
…とか思ったけど、別に深層学習いらなそうだからオーソドックスな機械学習だ!
…とも思ったけど冷静に考えてみたらだいたいタイトルか歌詞がツイートにテキストとして入っているんだから、ここはデータを用意して正規表現マッチだ!
…とさえ思ったんですが、結局それもやりませんでした。
データ分析するなら、まずは一旦中を見てみないとね。
というわけで、とりあえず最初の30コぐらいを目視で確認orわからないものはググってみる、をやってみました。
かかった時間を30で割って1000倍します。なるほど。
全部手作業でやっても、所要時間3時間ぐらい、とわかりました。
これ、手でやったほうが早いわ。
ということで、手作業で1000件の歌詞を割り当てました。途中からどんどん(わたしが)学習していって、Googleに頼らなくてもだいたいなんの曲だかわかるようになってきた〜💪
📦 < 俺が機械学習だ!!
小分けにしながら作業したので、トータルの作業時間はよくわかりませんでした。でもだいたい3時間ぐらい。
ところで今回わたし、1行1ツイートでテーブルを作りましたが、1ツイート1曲とは限りません。
正規化のためには本来テーブルを分けないといけませんが、そんなことをしていると(わたしの)パフォーマンスに影響するので、今回は1行1ツイートのままでいきました。
最後に、集計する。
し、集計とビジュアラアイズのトレンドはなんだ…jsでインタラクティヴなやつ…??
難しいことはちょっとよくわからないので、Googleスプレッドシートに放り込み、ピボットテーブルで集計してグラフにしました。
それがコレ!
というわけで、 #衝撃を受けたBUMPの歌詞 で一番よく言及された曲は『HAPPY』ということがわかりました!
2位と3位はそれぞれ『才悩人応援歌』『K』でした。どっちもシングルじゃないんだよな、というところにすごみを感じます。
悲しみは消えるというなら 喜びだってそういうものだろう
誰に祈って救われる つぎはぎの自分を引き摺って
サビのこの歌詞に惹かれたひとがおおぜいいらっしゃったみたいですね。
ところで。
わたしは歌詞の一部を切り取ってそれだけを愛でる文化があまり得意ではありません。
「歌詞ってそういうものじゃないじゃん!」みたいな高尚なことを言いたいのではなくて、一部分だけを切り抜いてもなにがすごいんだか当人以外にはたいていさっぱりわかんないんですよね…みなさんそうじゃないんですか……。
ただ、この「たいてい」には例外があって、ほんとうにそこだけ切り抜いてもちゃんと自立してきらきらする歌詞ってあるんですよね…。
テレビのコンセント抜いても付いてたらおっ?ってなるじゃん。そういう感じ。
BUMP OF CHICKENの歌詞にはそういうのがたくさんあります。
そして、そういう歌詞こそが、こういうハッシュタグの文化にぴったりなんだよな、って思うのでした。
この歌詞もとっても誠実で、Happy Birthdayの曲なのにこんなに飾らなくていいんだ…というのがとても新鮮で印象に残るサビでした。
ふつう記念のときにはきれいごと言っちゃうのにね。そうしないのがとても正直で誠実で印象的です。
今回もたくさんの歌詞を目grepして、おもしろい歌詞にたくさん出会えてよかったです〜🎂
来年もたくさんたのしい歌詞に出会えたらよいなと思います。
それでは、よいお年を〜🎍