Re: 語数 (HIGUCHI Koichi) KH Coder 旧掲示板
[ツリー表示] [留意事項] [ワード検索] [過去ログ]

  [No.3654] Re: 語数 投稿者:HIGUCHI Koichi  投稿日:2018/05/31(Thu) 06:52:58

こんにちは、樋口です。書き込みありがとうございます。

私の先の書き込み(No.3648)では、対応分析のような分析を実行するときに、
何種類の語を分析に含めるのかという観点から書かせていただきました。多す
ぎる場合に、どの程度、数を絞るのかということです。挙げた数値は、語の種
類数(異なり語数)です。


しかし、ご質問は、データ全体にのべ語数(総抽出語数)で何語が含まれてい
れば良いかというご趣旨だったのですね。

これについてもあまり明確な基準は申し上げられません。すぐに読み切れる程
度、たとえばA4用紙1枚程度であれば、計量テキスト分析を行なう意義は薄い
でしょう。単に目で読めば良さそうだからです。ですが、3枚から5枚を超えて
くると、すぐに読み切ることはできなくなります。そうなると、興味関心が異
なる人がデータを目で読んだ場合、「こういう言葉・内容が多かった」という
印象が必ずしも一致しない可能性が出てくると思います。こうなると、手元に
あるテキストデータがどんなものかということをなるべく正確に記述するとい
う目的で、頻出語リストや共起ネットワークを示す価値はありそうに思います。
この意味では、「すぐに読み切れない」量が1つの目安になりますでしょうか。


なお、本掲示板をお使いいただくすべての皆さまにお願い申し上げます。ご質
問の際には、お考えのことをなるべく詳しくお書きください。回答者が誤解に
もとづいて的外れなことを答えたのでは、ご質問の目的が達成されない恐れが
あるかと思われますので…。


- 関連一覧ツリー (■ をクリックするとツリー全体を一括表示します)