5日と20日は歌詞と遊ぼう。

歌詞を読み、統計したりしています。

【統計とかテキストマイニングとか】今年の私が、歌詞読みのお勉強のために読んだ本まとめ

こんにちは。
私の趣味は歌詞を読むことです。妄想を歌詞に当てはめてその一致を楽しんだり、ツイートをスクレイピングして歌詞と符合させたりして遊んでいます。
そのためにはたくさん知らないといけないことがあります。私はぜんぜん知りません。
そこで、私は、学ぶことにしました。この記事は学びの軌跡です。主に書籍をまとめました。
載せる本を選んだ基準は以下の通りです。

  • 私は、下記のあらゆる分野で初学者です。専門的なことはわからないので、入門書を選びました。
  • 私は、独学でお勉強します。ひとりで読んでも大丈夫だと思う本を選びました。
  • 私は、いろんな本を読みました。今回はその中でも、よかったものだけを選びました。

分野は、おおむね以下のように分かれました。

では、順番に書いていきます。読むときはお好きなとこからご覧ください。
統計学
最初は統計学です。
統計学本についてのまとめは、すでにたくさんあります。


が、私が最初に読んだのは、ここにはありません。
http://ruby.kyoto-wu.ac.jp/~konami/Text/
統計学テキスト
最初の一歩として圧倒的にオススメなのが、小波秀雄『統計学入門』です。Webで全文が公開されているからです。
私が推す理由は、Webで見られるからだけではありません。内容も初学者の私には大変よかったです。
ふつうの統計学の本だと、記述統計にはあんまり興味ない感じを出してきます。基礎になるはずの序盤がものすごいスピードなので、すぐについていけなくなりがちです。「平均」は中学でやったから知ってるでしょ? このへん飛ばすよ? みたいな口調でしゃべってきます。そのスタンスは、私には厳しいです…。
この本(というかPDF)だと、そのあたりがすごく丁寧なので、最初の一歩に大変よいです。たとえば、平均、メジアン、モードの比較についてだけで4ページ分も載っています♪ 検定のところの小噺も楽しいです。
私は全部を印刷して簡単に製本して、ボロボロになるまで書き込みしながらお勉強しました。
本当にモノになるのかわからないジャンルに踏み出すとき、お金をかけずに世界の入り口に立てるのは素晴らしいことだと思います。

次に読んだのがこれです。記述統計もおさらいできますが、この本のよいところは、検定の説明の丁寧さです。著者さんは農学の専門だそうで、農学でいうとどういう仮説を検証したいときにどういう手法を使うのか、が具体的に書いてあってめっちゃいいです。
さらに、章末問題の解答が丁寧なのが助かります。統計学の教科書だと、
1.問題が載っていなかったり、
2.載っていても解答がなかったり、
3.解答があっても解説がなかったり
しがちです。解説がないのは、独学者にとって致命的です。この本は解答が非常に丁寧なので、独学でもくじけずに済みます。問題は全部やってみよう!
あと、大学の教科書みたいな本だと、どうしてこうなった…と問い詰めたくなるようなやる気のない装丁の本がたくさんあります。でもこの本は、表紙も本文もかわいいのがとてもいいです。ブッカー(図書館の本にかかってる透明なカバー)をかけて大事に使うことにしました。

次に手を出したのがこの本です。
さっきまでの2冊、私は全部の問題を電卓を使って解きました。
でも、電卓でできる範囲には限界があります。サンプルサイズが20を超えたら、平均を出すのだって大変です…。
そこで使うのがコンピュータ! Rという言語を使って、統計学のことをお勉強するのがこの本の趣旨です。計算間違いがなくなるし、どうせ私は実用で使うならコンピュータを使うことになるので、その橋渡しとしてとても良い本でした。
統計学のことももちろんひと通りお勉強できます。この本は、変数の名前が日本語だったりして、プログラミングへの心理的な壁を低くしているのが好感が持てます♪
あと、Rを使うからといってなんでもブラックボックスにせず、統計の原理に基づいて計算の順序を追ってくれるので、とても誠実だと思います。手計算で原理を追いかけるのは大変だけど、そこはRが助けてくれます!
この本は、ブックオフでたまたま見かけたので安く買えました。ブックオフで素敵な出会いってほとんどないんですが、この本は別格でした。

これはこれから読む本。統計学の検定にはいろんな手法があり、調べたいことに応じて使い分ける必要があります。
この本はそんな、手法のカタログです。いつも座右に置きますので、役に立ってくれることを期待しています!

プログラミング
私はRubyとRを使っています。最近はPythonという言語が流行っているみたいですが、言語がどうこう言うのは私には早いはずです。たまたま出会った情報を頼りにがんばるぞ!Rubyについて読んだのはこの本。名前が出ているまつもとゆきひろさんはRuby創始者だそうです。生ける伝説じゃないですか!
Amazonだとこの本の評価あまりよくないんですが、私には信じられません。最初から最後まで読んで、引っかかる部分はそんなになかったけどなぁ。
電車の中で移動中とかに読んでいたので、練習問題のページには大きめの付せんを貼って、そこに手書きしてからあとで家に帰っておさらいしました。
Rubyにだいたいどんなことができるのか、わかったって点でも収穫は大きいです♪ いまでも繰り返し繰り返し手に取ります。

Rについて読んだのはこの本です。
後半は私の目的と違うので読みませんでしたが、前半はとてもいい感じでした。
翻訳とは思えないこなれた表現で、Rのことを手取り足取り教えてくれます。
RはRubyとぜんぜん書き方も違うし、やりたいことも違ってくるので、そのへんがはっきりしてくるのが楽しかったです。Rって、Rubyに比べて、使うのにアイデアというか、発想力が必要になる感じがします。
紹介の順序が前後しましたが、私はこれを読んでから『Rによるやさしい統計学』に挑戦しました。
私はこの本を「黄色い本」と読んでいたのですが、黄色いシリーズはいっぱいあるんですね…知らなかった…。

この本はほんとうに素晴らしいです。大好き。
タイトルの通り、Rubyクローラー(ネットから勝手に情報を拾ってくれるやつのことです)を作る本です。いいところは何と言っても、そんなに複雑じゃないプログラミングで、役に立つものが自分にも作れる!っていうことです。こういうモチベーションがわくのってすごくいいと思います。
本屋さんのプログラミングのコーナーに行くと、『◯◯言語でゲームを作る!』みたいな本がたくさんあります。ゲームが作れるってことがモチベーションにつながるのはわかりますが、今の私は大事なことを知っています。
ゲーム作るの、たぶんめっちゃ大変です…。
それに比べたら、クローラーを作るのは私でも(簡単なのなら)作れます。プログラミングって思ったより楽しいね!!
ちなみにこの本を片手に、私は下記の記事を書きました。

データマイニング
私が初めて読んだデータマイニングの本です。この本で、統計の手法が実際の研究とどういう風につながっているのかを知りました(実際には、この本を読んでから統計に関するお勉強を始めたんですが)。
取り上げられてるテーマもおもしろいです。たとえば「対話形式データのテキストマイニング」という章では、取り上げられるのが『機動戦士ガンダム』の台本です。だれからだれへの発話がどれぐらいあるか、を調べて図示していくと、このストーリーの中で対立しているふたつの勢力が浮かび上がってきます。すごい!
データもこの本のサイトにあるので、自分で手を動かして実践できます。手取り足取りやれる感じは、まるでだれかに教えてもらっているかのようです。
この本を片手に、人力検索で下記の回答を書きました。RMeCabさんありがとう☆



次に読んだ本はこれです。統計学のいろんな手法をRでやってみるための本です。これはぜったい、将来の私にとって役に立つでしょう。データマイニングの本をオススメするサイトに行くと、だいたいこの書影を見ます。
しかし、私にはまだ難しすぎました。開始から30ページで行列が出てきます。ムリムリ! 数学わかんないよ!!

数学
というわけで、数学のお勉強を開始しました。線形代数はぜんぜんわかりません。行列は一瞬習った気がする! 足し算ならできるよ!
いまの私はそういうレベルです。
でもそういうレベルからスタートしても、この本ならやさしく私を導いてくれます。わけがわからないまま、行列式とか余因子行列とかの計算をさせられる本も多い中、この本はナットクがドライブになって前に進む感じがあるのでとてもよいです。
手を動かす感じの本ではないので、この本から入門したら、別の教科書が必要です。

いま進めているのはこの本です。手を動かすタイプの教科書です。解説が丁寧なところに好感を持ち、これを選びました。
説明はかなり初歩からです。高校のベクトルのおさらいとかから始めてくれるの、大変助かります♪
あとですね、固有値のページのグラフが圧巻の迫力です。これがあったからこの本を選んだようなものです。大迫力!!(まだ理解はしてないから迫力しか感じてない)

ところで、ほかのブログとかを読むと、この本の評判がとても高いようです。本屋さんで立ち読みしたところ、私にはなんだか少し難しそうな感じがしました。もしかしたらじっくり読めばいいのかもしれませんが。

国語
ここからはジャンルを変えて国語のこと。
さっき、ゴールデンボンバーの歌詞をテキストマイニングで読んだ記事をご紹介しました。このとき、マイニングするとこまではマイニングの知識で太刀打ちできたのですが、そこから先は文法の知識がないと立ち行かなかったのでした。というわけで、国語のお勉強。この本は日本語の文法について、異常なほどの説得力で私たちを襲うバイブルです。文法のことで、裏を取りたいこととかがあれば私はまずこの本を開きます。
たとえば、中島みゆき『荒野より』に
朝陽の昇らぬ日は来ても 君の声を疑う日はないだろう
という歌詞があります。これ「朝陽の昇らぬ日“が”来ても」だったらニュアンスが違ってくるはずですよね。その根拠を持ち出したいときに、この本が大歓迎です♪
最近は辞書のように使うことが多いですが、いま久しぶりに適当な気持ちで手に取ったらやっぱりどのページも楽しいです。これはまた頭から通読しないといけないな!
この本を片手に、下記の記事を書きました。



さっきの本が文法のことなら、こちらの本は語彙のことです。要は辞書なのですが、各項目の詳しさが素晴らしいです。今たまたま開いた「落ちる」という言葉には4ページにわたって説明が出ています。
で、たとえば、ものが水面に落ちるとき、水面までは「落ちる」と呼ぶけど、水面から底までは「落ちる」じゃなくて「沈む」っていうんですよね。
そういうことも含めて、この項目には図が3つもあります。たったひとつの単語に対してです。
読み始めるといつの間にか時間が過ぎます。ステキすぎる時間泥棒です。

文学理論
先日、人力検索でこんな質問をしました。

この質問でたくさんの本を教えてもらいましたが、中でも(いまのところ)出色なのがこれです。大学の教授が文学理論の授業をする、という設定の小説です。最初は小説部分がつまらなくて、そこだけ読み飛ばしてしまおうかと思ったのですが、途中からは小説の先が気になりだして、それが読み進めるモチベーションになりました。
私は歌詞を取り上げて、その意味とかと効果とかをあれこれ考えていますが、それって昔から小説で行われてきたことと一緒なのです。なら、援用させていただくしかないじゃないですか!
この本は文学理論のカタログみたいにして読めるので、いろんな手法があるのを見ながら、そのときどきで合ったやり方を選ぶことができます。本来ならここから、それぞれの手法の専門書に移らないといけないのですが、そこまで手が回っていません…。
めっちゃ付せんを貼って、メモを取りながら読みました。自分の血や肉になったかと言われると口ごもってしまいますが、ちゃんと生かせるようにがんばりたいです♪

というわけで、テクスト論の古典です。自分はどうもテクスト論に依拠しているみたいだと思ったので、ルーツを辿ってみました。
こういう古典って、たいてい私ぜんぜん頭に入ってこないんですよ…。脳みそが残念なのだし、翻訳物に弱いのかもしれないです。しかしだからといって英語やフランス語で読めるかと言われるとそんなわけがなく、結局日本語で読んでふわふわした気持ちが残っていました。
が、この本はいい感じでした。短い論文のアンソロジーなので、わからなくなる前に読みきれます! 私の理解が浅いのだと言われたら反論できないし、実際「この点はどう考えたらいいんだろう…」ってポイントはたくさんあったのですが、書いてあることがさっぱり理解できずに一歩も前に進めない、ということにはならなかったので、それだけで私にとっては収穫でした。

[asin:4062122073:detail]
さらに少し前に読んだのがこの本です。が、特に後半はさっぱり頭に入りませんでした。なので原点に立ち返ってバルトを読んだ、という経緯がありますのですよ。
私は、歌詞読みはだれのものか、という疑問を持っています。私の解釈は私のものかもしれませんが、もしかしたらそう思わせているのは作者のほうで、私は作者の思い通りに踊らされているだけかもしれません。でも、作者って本当に存在するのかは疑問です。秋元さんに会ったことがない私にも、AKBの曲は聴くことができるのです。変なの。
この本の内容、私にはちょっと重かったです。でも、この本で考えていることは私が考えるべきことといっしょ、という強い手ごたえは確かに感じたので、何度でもこの本に戻ってこないといけないと私は思っています。
この本の内容、テクスト論の理解に誤解があるよ、というAmazonのレビューもありますが、そうだとしたら誤解の内容が私にもはっきりわかるようになりたい! がんばろう。

音楽
さて、コード進行を基礎からお勉強するならこの本。私が持っているのは3冊?に分かれている方ですが、お家で楽器とかを触りながらお勉強するなら1冊にまとまってたほうが便利ですよね。
知識ゼロからコード理論をお勉強するなら、この本がいいと思います。
音楽の本って、謎のフィーリング重視の本が多かったりして辟易することないですか? その点この本はわりといい感じだと思います。口調がときどきチャラいけど。

こちらはコード進行の辞書みたいな本です。
たとえばIV→V→IIIm→VIm、っていう進行が出てきたら、それを引けば詳細がすぐにわかります。とってもお手軽で、進行を調べるのにもってこいの本です。類書がないのが不思議。
この本を片手に、下記の記事を書きました。

グッズ
最後にグッズ。統計のお勉強をするなら電卓が必須です。スマホの電卓とかぜんぜんダメだからね!
最初、私は家にあったカシオの安いやつを使っていたのですが、どうしても好きになれなくて手放しました。なぜかというと、たまたま友だちが持っていたこの電卓が非常に使いやすかったからです。友だちが、
「私のコレいいよ! おすすめだよ!」
って言ってて、たかだか電卓にそんなに差があるわけあるか〜い!って思いながら触らせてもらったら、あっさり世界が変わりました。
というわけで、その週のうちに私は電卓を乗り換えました。オフラインだとライフでしか見たことないということで、私もライフで買いました。
ずっと触っていたくなる、キータッチが最高です。好きになれる道具があると、お勉強もはかどりますマジで。この価格帯ならとってもイイと思います。Amazonで売ってると思わなかった。
ちなみに、カシオをさっき悪し様に言いましたが、カシオの高いやつは本当にイイです!店頭で触っただけですが、感動で声を上げてしまった…(恥) いつかはカシオ♪

あとさ、みなさん高校生のときとかと比べて、書くものに無頓着になっていませんか?
筆記具がイイと、書くことが楽しくなるのです。書くことが楽しくなると、お勉強がはかどります!
そういうわけで、0.9mmのシャーペンを買いましょう。コクヨのやつは安いからデビューにぴったり。0.9mmって、紙の上でのびのびとペン先が動くから、たくさん書いてる自分カッケー!的な気持ちになれるはずです。
まとめ
お疲れさまでした。
これだけ押さえれば、きっと楽しい気持ちでお勉強できます。私もまだまだです。いっしょにがんばりましょう。
ちなみに来年は、私こういう感じで考えています。
まず、数学はある程度のところでお勉強をやめます。具体的には、固有値とかを理解できたら中断したい気持ち。私は、線形代数は歌詞を理解するための手段と思っています。理解できそうな手ごたえを得たら、すぐにでもやめたい気持ち…。
で、統計学のお勉強に注力します。基本的な検定とかは、間違えずにふつうな気持ちで使えるようになりたいです。その上で、いろんな統計の手法も、本を見ながらならわかるようになりたいです。これが来年の目標。
そのさらに先には、ベイズ統計学、そして機械学習という、別のジャンルが待っているようです。歌詞と関係が深そうだったら、ぜひ飛び込もっと。
国語はいろいろ弱いのですが、気になってるのは音韻論です。音韻論は少しわかるだけで、私にとってのコード理論のように便利に使えるような手ごたえがあるので、早めにとりかかりたいです。このあいだ見つけた子音ピボットのこととかが理解しやすくなるはずです。
文学理論はめっぽう弱いので、なんとかしないといけません。とりあえず『文学部唯野教授』に出てくる各ジャンルの入門書は見てみたい感じです。あとラカン読みます。ぜったいこれこれ避けて通れない感じ。
また、コード理論以外の楽典のことを学びたいです。リズムとか構成とか。いい本ないかなぁ。
そういう感じです!

さて、今年の記事はこれでおしまいです。
どうせみなさんだって、年末年始に少しぐらいは休日あるんでしょう? クリスマス引きこもってる人とかいるんでしょう?
それなら、2015年はお勉強の年にしましょう。いっしょにがんばりましょうね!(๑˃̵ᴗ˂̵)و

次回予告:次回は2014年のいろんな音楽を統計的な手法で比較したい気持ちです! カラオケで人気の曲と、オリコンで売れた曲には、歌詞の違いはあるかな?みたいなことを考えたいです♪