[掲示板へもどる]
一括表示

  [No.2363] 共起ネット描画の際のJaccard係数 投稿者:KOZUKARYO  投稿日:2016/01/16(Sat) 15:57:59

デフォルトでは,Jaccard係数を算出する際の集計範囲が前後5になっているとマニュアルに書いてありますが,これを変更することはできますか?また,何らかの客観的基準に基づいてデフォルトが5になっているのでしょうか?


  [No.2365] Re: 共起ネット描画の際のJaccard係数 投稿者:HIGUCHI Koichi  投稿日:2016/01/16(Sat) 16:30:03

こんにちは、樋口です。書き込みありがとうございます。

マニュアルのどの部分に、なんと書いてありましたでしょうか?

共起ネットワークでは文・段落・文書など、ユーザー指定の単位で計算できま
す。デフォルトは「段落」です。

デフォルトで前後5語というのはコロケーション統計の方で、コロケーション
統計の画面では原則的に、当該分野(英語コーパス研究)で広く利用されてき
たWordSmith Toolsに倣った(近似的な)計算法をとっています。


  [No.2366] Re: 共起ネット描画の際のJaccard係数 投稿者:KOZUKARYO  投稿日:2016/01/16(Sat) 16:36:51

よく見たらそうですね。申し訳ございません。段落になっているというデフォルトの設定の見直し方も含めてもう少し触ってみます。

> こんにちは、樋口です。書き込みありがとうございます。
>
> マニュアルのどの部分に、なんと書いてありましたでしょうか?
>
> 共起ネットワークでは文・段落・文書など、ユーザー指定の単位で計算できま
> す。デフォルトは「段落」です。
>
> デフォルトで前後5語というのはコロケーション統計の方で、コロケーション
> 統計の画面では原則的に、この分野で広く利用されてきたWordSmith Toolsに
> 倣った(近似的な)計算法をとっています。


  [No.2367] Re: 共起ネット描画の際のJaccard係数 投稿者:HIGUCHI Koichi  投稿日:2016/01/16(Sat) 17:55:48

いえいえ、不味い記述があるようなら直しておかないと思ったのです。

オプション画面の一番右上に「集計単位:段落」という部分があるので、
ここで切り替えられます。

「段落」「文」以外の単位を指定するためには、H1〜H5タグを使った
見出しを入れる必要があります。

あと、テキストファイルの場合は「段落」がデフォルトですが、Excel・
CSVファイルを分析対象ファイルとして指定した場合に関しては、1つ
1つのセル(H5)がデフォルトになっています。