Re: 「文書のクラスター分析」における「プロット」ボタンについて (関口) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.1530] Re: 「文書のクラスター分析」における「プロット」ボタンについて 投稿者:関口  投稿日:2013/12/17(Tue) 21:58:32

樋口先生

こんにちは、関口です。返信が遅れてしまい、大変申し訳ありません。
その後、さらに検証を進めたところ、「Ver 2.beta.30d、Ver 2.beta.30f
のいずれでも『プロット』ボタンが表示されるデータ」と、「Ver 2.beta.30f
では『プロット』ボタンが表示されないが、Ver 2.beta.30dでは『プロット』
ボタンが表示されるデータ」があることが判明しました。

(1) Ver 2.beta.30d、Ver 2.beta.30fのいずれでも『プロット』ボタンが
表示されるデータ
比較的小規模なデータ。「文:572」「段落:252」「h2:84」
「使用される語の数:159」(名詞のみ。最小出現数:5、最小文書数:1)

(2) Ver 2.beta.30fでは『プロット』ボタンが表示されないが、Ver 2.beta.30d
では『プロット』ボタンが表示されるデータ
中規模のデータ。「文:3162」「段落:1489」「h2:497」
「使用される語の数:284」(名詞のみ。最小出現数:15、最小文書数:1)

(1)及び(2)で共通の処理内容:
・集計単位:h2
・方法:Ward法
・距離:Jaccard
・クラスター数:10
・chasenでの前処理には、Ver 2.beta.30d、Ver 2.beta.30f共に
 共通の自作ユーザ辞書(MyDic.dic, テキストファイル:34KB)を使用。

状況としては以上のような感じです。
もし必要であれば、上述の(2)に該当するデータ(約511KB、公開特許
文書ですので、著作権上の問題は無いと思います)及び上述のMyDic.dicを
メールにて送付させて頂くことも可能です。

よろしくお願い致します。


> こんにちは、樋口です。書き込みありがとうございます。
>
> えっと、その「プロット」ボタンを取り除いたつもりはなかったのですが、な
> くなっていますでしょうか。
>
> 文書のクラスター分析のオプションで「方法」として「CLARA」以外のものを
> 選択なさっていることをご確認ください。「CLARA」の場合のみ、方法の特性
> に関する理由でデンドログラムを作成できないため、このボタンを非表示にし
> ています。例えば「Ward法」をお使いいただきますと、ボタンがでてこないで
> しょうか。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)