読者です 読者をやめる 読者になる 読者になる

ただ眠いんだ

When I'm in the middle of a dream...

テキストマイニングでみるシンガーソングライターが歌っていること…奥華子編

人-奥華子 趣味 趣味-テキストマイニング

テキストマイニングとシンガーソングライター、第二弾は奥華子である。
ちなみに第一弾、スガシカオ編はこちら

世間的には奥華子といえば失恋ソングとCMの人、あと時かけのエンディングの人…という認識だろうか。

その世間のイメージはどのくらい適格なのか、テキストマイニングで見てみようと思う。

マテメソ

メジャーデビュー後のオリジナルアルバム、そしてインディーズのベストアルバム、vol.bestに収録されている曲の歌詞を使用した。
「vol.best」「やさしい花の咲く場所」「TIME NOTE」「恋手紙」「BIRTHDAY」「うたかた」「good-bye」「君と僕の道」「プリズム」の9枚から116曲である。

また、テキストマイニングには「KH Corder」を使用した。

結果

頻出語について

奥華子の歌詞の中で多く使われている言葉ベスト50はこちらである。

抽出語 出現回数
1 118
2 116
3 113
4 好き 107
5 言う 98
6 笑う 97
7 89
8 歩く 81
9 思う 80
10 知る 77
11 見える 74
12 忘れる 69
13 生きる 68
14 言葉 66
15 泣く 63
16 見る 63
17 幸せ 57
18 56
19 明日 56
20 55
21 会う 54
22 探す 53
23 51
24 自分 51
25 51
26 今日 50
27 50
28 いつ 48
29 優しい 48
30 会える 47
31 変わる 47
32 誰か 46
33 強い 44
34 寂しい 42
35 場所 42
36 42
37 42
38 41
39 出来る 41
40 無い 41
41 愛す 39
42 39
43 39
44 言える 38
45 笑顔 36
46 気持ち 35
47 行く 35
48 いつか 33
49 繋ぐ 33
50 少し 33

トップ5は

  • 好き
  • 言う

である。
なんとなく奥華子のイメージと近い言葉が並んでいる。

「今」はスガシカオの頻出後でも1位になっているが、奥華子の歌詞でも高頻度で登場しているようだ。
歌詞を見ていると、アルバム「Time Note」の「変わらないもの」の中では6回「今」と歌われているし、同じアルバムの隠れた(?)名曲「桜並木」では5回登場している。

他にも15位「泣く」、17位「幸せ」、34位「寂しい」、46位「気持ち」、49位「繋ぐ」など、なんとなく恋愛にまつわる歌詞に登場しそうな言葉が並んでいる。
やはり、「人と人との関係、特に恋愛」にまつわる歌詞が多そうである。

共起ネットワークによる言葉のつながり

語句同士の関連を調べてみるとこんな感じになる。

奥華子共起ネットワーク

かなり象徴的な固まりがいくつか表れている。 「手」を「強く」「繋ぐ」
「好き」な「気持ち」を「言う」
「笑顔」に「変わる」「明日」に「行ける」
「誰か」を「愛す」
といった明るいものから

「恋」「愛」「探す」「ない」
「遠い」「離れる」「消える」
といった悲しみを連想させるものも見つけることができる。

奥華子はどのくらいの割合で恋愛を歌ってきたのか

実際に奥華子の歌詞はどれくらい恋愛について歌っているのかを調べるために、頻出後トップ150から、恋愛に関係ありそうな言葉を抽出。
また、比較対象としてスガシカオの歌詞頻出後トップ150からも言葉を抽出し、それぞれの歌詞でどの程度の割合で含まれているのかを調べてみた。 この操作をコーディング抽出と呼ぶ。

1曲の中に1つでも一致する言葉があれば恋愛にまつわる曲であると判定した。

抽出に使った言葉
「愛」「恋」「恋愛」「キス」「抱きしめる」「好き」「愛す」「一緒」「口づけ」「片思い」「片想い」「あなた」「女」「別れ」「寂しい」「想う」「喧嘩」

スガシカオと奥華子恋愛比率

結果を見てみると、スガシカオでは51%の曲が恋愛に関連する言葉が登場するが、奥華子ではなんと82%を記録した。

他のアーティストでの数字が明らかになっていない状態で単純に数字を比較して「奥華子は恋愛の歌詞が多い!」というのはちょっと早計であるが、かなりインパクトのある差と言えるのではないか。

じゃあ、失恋は?

失恋にまつわる言葉を抽出するのは非常に難しい。失恋に関する歌詞に「失恋」という言葉が入ることの方が珍しいだろうし、失恋に関係ありそうな「別れ」のような言葉しか出ないのであれば、それはシンガーソングライターとしてどうなの…という感じがする。 複雑な感情を表現する歌詞に対して、テキストマイニングはなかなか手が出しにくいのかもしれない。

ということで「失恋」よりもうちょっと単純な「暗い」言葉を拾ってみることにした。選び方は先ほどの「恋愛」に関する言葉の選び方と同じである。

抽出に使った言葉
「嘘」「涙」「悲しみ」「闇」「サヨナラ」「死ぬ」「我慢」「問題」「悪い」「孤独」「大嫌い」「痛み」「泣く」「寂しい」「迷う」「二度と」「苦しい」「忘れる」「離れる」「悲しい」

スガシカオと奥華子暗い比率

スガシカオ67%に対して奥華子93%!
スガシカオの歌詞は暗いなあと思っていたのだけど、こちらでも奥華子の割合の方が高い!
「暗い」「恋愛」の歌ということは、失恋ソング…という結論に至る…と思いきや、まだ続きがある。

奥華子はストレートに感情を歌っている

半分まとめのようになるのだけど、「暗い」「恋愛」の歌が多いからと言って失恋に関する歌詞が多いと結論づけるのは早計である。
先ほどのコーディング抽出を「明るい」言葉に対してやってみるとスガシカオ68%に対して奥華子88%となる。
これでは「明るい曲」「暗い曲」を足すと100%を超えてしまう。

注目したいのは、明るい曲でも暗い曲でも恋愛の曲でも奥華子の方が割合が高くなっているという部分である。
少なくともスガシカオと比較して、奥華子はコーディングに引っかかりやすい、ストレートな言葉を使った歌詞を書いていると言えるのではないか…

と、また具体性の乏しいというか、普通の結論に至ってしまった。
やはりデータが少ないとクリティカルな結論は出ないのか…