5日と20日は歌詞と遊ぼう。

歌詞を読み、統計したりしています。

Official髭男dismの『Cry Baby』と『ミックスナッツ』で計量国語学を自由研究する夏🌻

Official髭男dismの『Cry Baby』を久しぶりに聴いてました。

いい曲〜〜!

で気づいたことがあるんですけど、この歌詞、動詞多くないですか?

目視で動詞を見つけて色をつけてみました。こういう感じになるはずです。

胸ぐらを掴まれて 強烈なパンチを食らっよろけ
肩を並べうずくまっ
予報通りの雨にお前はにやけ
「傷口が綺麗になる」なんて嘘をつく
  
いつも口喧嘩さえうまく出来ないくせ
冴えない冗談言うなよ
あまりのつまらなさに目が潤ん
  
何度も青アザだらけで涙を 流して 流し
不安定な心を肩に預け合いながら 腐り切ったバッドエンドに抗う
なぜだろう 喜びよりも心地よい痛み ずっしりと響い
濡れた服に舌打ちながら 腫れ上がった顔を見合っ笑う
土砂降りの夜に 誓ったリベンジ

Official髭男dism『Cry Baby』歌詞

めちゃくちゃ多い……

動詞が多いと、ああなって、こうなって、そうなって…みたいに、シーンがどんどん変わる感じ。マンガみたい。

これがどれぐらい多いかは、他の曲と比べてみるとわかります。

たとえば、最新曲の『ミックスナッツ』でやってみます。

袋に詰められたナッツのような世間では
誰もがそれぞれ出会った誰かと寄り添い合って
そこに紛れ込んだ僕らはピーナッツみたいに
木の実のフリながら 微笑み浮かべる
  
幸せのテンプレートの上 文字通り絵に描いたうわべの裏
テーブルを囲み手を合わすその時さえ ありのままではられないまま
  
隠し事だらけ 継ぎ接ぎだらけのHome, you know?
噛み砕いても無くならない 本音が歯に挟まったまま
不安だらけ 成り行き任せのLife, and I know
仮初めまみれの日常だけど ここに僕がて あなたが
この真実だけでもう 胃がもたれてゆく

Official髭男dism『ミックスナッツ』歌詞

ミックスナッツは動詞少ないよな?

こちらは動詞が少ないので、ひとつひとつの要素についてああいう風で、こういう風で、そういう風…って掘り深めていく感じ。

きょうはこの差について数えたりするぞ! 夏休みの自由研究〜〜🌻⛵️🏄‍♀️🌊🍧🌽🌈✨

とりあえず、この2曲の違いについていったん数字にします。

ぱぱっと出せる指標として、文字数あたりの動詞の個数を比較してみましょう。

するとこうなります。

タイトル 動詞の個数 文字数 割合
Cry Baby 24 240 10.0%
ミックスナッツ 16 276 5.8%

『Cry Baby』のほうが2倍近い割合です。

10文字歌ってたら1つ動詞があるペースです。多くない?

ふつうこんなに多くないと思うんですよ。

(……ほんとう??)

実はこれ系、先行研究があるんです……! 50年以上も前の樺島・寿岳の研究です。

ぶっちゃけわたしは原典当たってないんですけど、計量国語学会『データで学ぶ日本語学入門』で見てみます〜!

さて、歌詞を単語に分割して、品詞を4つに分類します。

記号 内容
N 名詞
V 動詞
M 形容詞・形容動詞・副詞・連体詞
I 接続詞・感動詞

たいていの文章は名詞が多いので、名詞に対してほかの品詞グループがどれぐらいの比率があるかを確認することができます。

このバランスを確認しましょう!

先ほど気になっていた2曲について、Python書いて出してみました。

形態素解析器はMeCab、辞書はIPAdic、解析の結果は手修正していません。

タイトル N V M I
ミックスナッツ 60.0 30.0 10.0 0.0
Cry Baby 52.0 40.0 8.0 0.0

『ミックスナッツ』は動詞が名詞の半分しかないけど、『Cry Baby』だと動詞が名詞の77%ぐらいあります。

やっぱり動詞多いんだよな〜〜。

Official髭男dismの他の曲も含めて全部散布図を描いてみます。こうです。

『ミックスナッツ』はだいたい回帰直線に乗っているので、名詞と動詞の比率はだいたい平均ぐらいです。

一方で、『Cry Baby』は直線よりもだいぶ上にあるので、名詞から想定される動詞の割合よりもだいぶ動詞が多そうです!

ほら!やっぱり!!

って言いたい気持ちもあるんですけど、それよりもさらに上にも点がいくつかあるんですよね〜〜〜

たとえば一番左上にある、n=39、v=55ぐらいのやつ、これはなに?

『Trailer』でした。

実際に歌詞を見てみましょう。こういう感じです。

僕は待ってる 僕は待ってる 滑り台の上、腰掛け待ってる
月が笑ってる 街は眠ってる 払えば飛ん行く埃みたいな風景
僕は待ってる 僕は待ってる そこはかとない暮らしで暇を潰し待ってる
何もないなら 異論はないかな それでも気付けば運命を憂えてる

Official髭男dism『Trailer』歌詞

いやめちゃくちゃ動詞あるじゃん!

ところで。

ある文章の品詞構成比率から文章の表現的特徴を判定する文章指標にMVRというものがあります(前掲の本のp.51)。

MVRは

MVR = M / V * 100

こういう定義になっています。Mは形容詞・形容動詞・副詞・連体詞です。そしてVは動詞。MVRは動詞1つにつき、形容するような単語がどれぐらいあるかを示していることになります。

MVRと、N(名詞)の比率を組み合わせて、それぞれの曲に2次元のデータを持たせることを考えます。

そのとき、
1.名詞比率Nが大きく、MVRが小さい文章は「要約的な文章」
2.Nが小さく、MVRが大きい文章はありさま描写的な文章」
3.Nが小さく、MVRも小さい文章は「動き描写的な文章」(前掲の本p.52)
といえます。

考えるとこれわかるんですよね〜文章を要約しようとすると名詞が残る感じあるし、MVRはありさま(形容詞系)を描写するか動き(動詞系)を描写するかのバランスをある程度示すのもナットクですよね〜。

先行研究では、いろんなジャンルの文章のNとMVRをすでに出してくれています。こちらもプロットしてみます。

こんな感じ。

ジャンルごとにいろんなばらつきがあります。

たとえばいちばん左上は「談話語」。

たぶん談話語っていうのはふだんのおしゃべりだと思います。Nが少なくて、MVRが高いということなので、名詞が少なく、動詞もあるけど形容詞的な単語が多いということなります。

しゃべるときは
「暑いね」
「ねーやばいねー」
みたいな会話しがちですからね。

上記の場合はN=0でとても少なく、MVR=2/0で定義できないとなり、完全に上記の談話語の特徴を反映していることがわかります(ほんとに?)

反対側の端っこには「新聞見出し」とあります。たぶんこれは新聞記事の見出しだと思うんですけど、見出しは名詞が多く、形容詞系はとても少なくなるということになっています。

考えてみると、たとえば見出しって
「ハコサト、夏休みの宿題に遅れか」
って感じになり、N=4/7でさっきよりかなり増え、MVR=0/0で引き続き定義できないとなり、やはり上記の特徴をよく反映しているとわかりますね。ほんとか? 例が悪いのでは??(例が悪いです)

さて、この散布図の中に、Official髭男dismの楽曲も混ぜ込むことができます。

やってみましょう〜!

(先行研究とヒゲダンの品詞の判定はルールが揃っていない可能性が高いです、ご参考ていどに〜)

『ミックスナッツ』はやはりわりと真ん中らへんに位置していて、NとVの散布図を描いたときと同じような傾向が見えます。

一方で『Cry Baby』はVの割合が多いこともあり、MVRは低くなります。

ありさま描写的な文章」といえそうです!

しかし、低いっていっても、さらに低いものもいくつかある模様……。

MVRが低い上位3曲と、あと『Cry Baby』のMVRを並べるとこういう感じです(『Cry Baby』は低いのから7番目、全体の10%の位置でした)。

曲名 MVR
可能性 (prod.Masayoshi Iimori) 4.76
ブラザーズ 6.81
発明家 14.29
Cry Baby 20.00

この上位3曲はNも多いので、傾向としては新聞記事の見出しに近く、「要約的な文章」と言えそうです!

たしかに歌詞までじっくり見てみると……

  • 「年の瀬/積み上がりゆくファイルの山」
  • 「あっちもこっちもシュガーレス
  • 「誰もが明日の発明家」

が新聞記事のタイトルっぽいって言われたらそんな気もしてきますね……!

この散布図からは、ほかにもいろんなことが読み取れそう。

『Cry Baby』のすぐ上にもうひとつ別のマルがあります。このマル、距離が近いってことはもしかして歌詞が似てるってことか……?

何の曲か調べてみたら、『Clap Clap』でした。なんかタイトルからして似てる……期待大!

歌詞を見てみるとこういう感じ。

clap clap clap 手を叩け! 憂鬱を追い出せ
報われない」なんてさ 立ち止まってなんかいないで clap clap clap 目を覚ませ! 退屈を抜け出せ!
すばらしい世界さ 目を開いてちゃんと見つめ

Official髭男dism『Clap Clap』歌詞

えっ、似てる…!

もう一度『Cry Baby』を見てみるとこう。

何度も青アザだらけで涙を 流して 流して 不安定な心を肩に預け合いながら 腐り切ったバッドエンドに抗う なぜだろう 喜びよりも心地よい痛み ずっしりと響い濡れた服に舌打ちながら 腫れ上がった顔を見合っ笑う 土砂降りの夜に 誓ったリベンジ

Official髭男dism『Cry Baby』歌詞

VしてVして…って言い方をずしずし重ねる感じがそっくりですね!

こうやって似た曲を見つけることもできるんですね〜! なんかうれしい〜〜!!

ところで。

もう一度散布図を見てみます。

MVRが100を超えた曲がひとつあるんですよね。100超えはやばない??

見てみました。この曲でした。

曲名 MVR
Pretender 102.17

は? 『Pretender』??

グッバイ
それじゃ僕にとって君は何?
答えは分からない 分かりたくもないのさ
たったひとつ確かなことがあるとするのならば
「君は綺麗だ」

Official髭男dism『Pretender』歌詞

そういう観点で見てみると確かにこの歌詞は、どんどんシーンが変わるような歌詞ではなくて、心の内面の深みにどんどん踏み込んでいくような歌詞でした。

MVRが高いというのにも納得かも!ってなりました。

MVR指標を使って、なにを志向している歌詞かがある程度わかるのかもしれないですね! ってなりました。

たのしかったです!!

さて、最後に。

参考資料として、今回わたしが見ていたOfficial髭男dismの楽曲を、MVRが低い順に列挙します。

するんだけどさ、わたしこの並び、だんだんラブソングになっていくように見えるんです。

よければそういう気持ちでスクロールしてみてください。

それでは引き続き、楽しい夏をお過ごしください🌻⛵️🏄‍♀️🌊🍧🌽🌈✨

タイトル N MVR
可能性 (prod.Masayoshi Iimori) 63.77 4.76
ブラザーズ 76.35 6.82
発明家 64.95 14.29
始まりの朝 54.07 14.49
たかがアイラブユー 63.16 15.87
Trailer 39.50 18.33
Cry Baby 52.00 20.00
Rolling 73.16 20.00
Choral A 45.16 20.00
最後の恋煩い 59.20 20.34
parade 45.54 20.45
未完成なままで 59.29 23.91
HELLO 56.11 24.19
Clap Clap 52.26 24.56
Laughter 55.91 25.33
ESCAPADE 58.13 25.49
されど日々は 38.83 25.53
Universe 55.67 25.76
恋の前ならえ 50.00 29.17
Rowan 37.70 29.31
夏模様の猫 52.17 29.41
Stand By You 67.30 30.19
日曜日のラブレター 53.77 30.88
I LOVE... 57.67 31.15
ペンディング・マシーン 48.88 31.34
旅は道連れ 54.55 31.71
イコール 58.27 31.82
愛なんだが… 41.06 32.84
ミックスナッツ 60.00 33.33
宿命 59.60 33.33
What's Going On? 62.50 33.33
夕暮れ沿い 48.75 33.90
FIRE GROUND 70.83 34.15
みどりの雨避け 61.17 34.48
エスタデイ 57.92 34.55
バッドフォーミー 54.00 35.38
Happy Birthday To You 50.36 35.42
Driver 68.70 36.54
異端なスター 46.98 36.59
コーヒーとシロップ 47.00 36.62
Anarchy 52.05 37.29
55 77.25 37.50
Shower 51.03 38.00
黄色い車 48.03 38.18
恋の去り際 43.51 38.71
フィラメント 45.61 40.91
破顔 54.17 41.18
ビンテージ 52.38 41.67
アポトーシス 50.91 42.11
雪急く朝が来る 48.12 43.48
Bedroom Talk 49.61 45.45
Tell Me Baby 72.86 46.94
パラボラ 53.93 47.27
ゼロのままでいられたら 51.10 48.28
始発が導く幸福論 47.45 50.00
Lost In My Room 52.76 51.28
ニットの帽子 50.43 51.35
Editorial 42.11 51.85
Sweet Tweet 52.78 52.27
Amazing 60.89 53.33
115万キロのフィルム 52.89 55.38
Travelers 50.00 61.54
ラストソング 46.41 63.27
ノーダウト 66.67 65.52
ダーリン。 35.52 70.59
相思相愛 41.01 73.33
犬かキャットかで死ぬまで喧嘩しよう! 53.94 73.81
Second LINE 54.36 85.71
LADY 53.64 94.44
Pretender 54.55 102.17

この本はおもしろいのではあるんだけど、わたしが今回読んでいた「文章・文体」のほとんどが樺島・寿岳の研究の話だったのはすごいよなって気持ちです。1965年からいままでの計量国語学の進捗もっと知りたいな!