樋口先生さま
お世話になります、袋井と申します。
いつもありがとうございます。
ご教示いただき、ありがとうございました。
御礼が遅くなり、失礼をお詫びいたします。
マニュアル、チュートリアルを何度も見ながら追試していますが、よく理解できません。
どのような質問をしたらよいのか苦慮しており、返事が遅くなりました。
分かりにくい変な質問かもしれませんが、よろしくお願いします。
(1)
サンプルのbayes_training.csvには、「学習用」「正解」の2種類のデータが用意されています。
メニュー【ベイズ学習による分類】−【外部変数から学習】の画面において、
学習する外部変数で、「学習用」を明示的に指定しますが、
以降、「正解」を明示的に指定する場面はどこにもありません。
「正解」は、どの処理で参照しているのでしょうか?
「学習用」「正解」という変数名は予約語であり、他の変数名ではいけないのでしょうか?
この2種類のデータからなるファイルを用意しなくてはならないのでしょうか?
「学習用」の1種類のデータしかないとすれば、学習処理はできないのでしょうか?
(2)
メニュー【ベイズ学習による分類】−【学習結果を用いた自動分類】の画面において、
変数名に未だ使用されていない変数を設定して、
「分類ログをファイルに保存」にチェックを入れて、処理をすると、
「指定された名前の変数がすでに存在します」とメッセージが出力されます。
一方、「分類ログをファイルに保存」にチェックを入れなければ、上記メッセージは表示されません。
私の操作に間違いがあるのかもしれませんが、
チェックの有無の違いによる振る舞いの違いは、これでよいのでしょうか?
(3)
マニュアルのp75の図43「外部変数から学習」において、最小出現数が1、最小文書数が3と設定されています。
出現数は必ず文書数以上となりますので、この設定には違和感を感じます。
出現数を最小文書数よりも小さく設定する特段の意味は何でしょうか?
(4)
メニュー【外部変数と見出し】【読み込み】【csv】で、
既に読み込んだファイルがある場合には、変数の上書きを確認するメッセージが表示されます。
これを避けるために、既に読み込んだ外部変数ファイルを削除したい場合には、どのような操作をすればよろしいのでしょうか?
以上、変な質問でご迷惑をお掛けしますが、よろしくお願いします。