お返事ありがとうございます。
具体的に申しますと,オリコンランキングにランクインしている曲TOP30のコードを数十年分,分析したいと考えております。コードとは具体的にC,D,E,Fといったメジャーコードから,C7,Cm7,Csus4,C#,Cadd9などといったものまで多数になります。
sus4や#やadd9などは,語の取捨選択に強制抽出語として追加したところCとsus4のようにわかれてしまったため,xなどに置き換えようかと考えています。
分析の方向としましては,まず,全曲の出現コードと出現回数を調べます。その後,サビの初めの2つのコードだけを抽出したものや曲の初めのコードだけを比較して,グラフ等に起こして時代ごとにどのような曲調の違いがあるかなどを分析していこうと考えております。
添付ファイルは,一曲の例を示したものです。
|