こんにちは、樋口です。書き込みありがとうございます。
(1)外部変数の「topic1」から学習を行い、その結果をファイル「t1」に保
存します。次に(2)「t1」を使って、学習に利用していない新たなデータの
自動分類を行います。これによってtopic1に「1 言及した」か「2 していな
い」かという自動分類の結果が、変数として得られます。
これを他のtopic2、toipic3、etc.についても繰り返せば、各トピックに言及
したかしていないかという2値変数が、トピックの数だけ得られます。
この結果、文書がトピックのどれか1つに分類されるという排他的な分類では
なく、1つの文書が複数のトピックを含みうる(複数の変数の値が「1 言及し
た」になりうる)という非排他的な分類となります。非排他的な分類という意
味で、コーディングと同様の分類になります。