こんにちは、樋口です。書き込みありがとうございます。
> 基準がよくわからない
強制抽出したものは全て「タグ」という品詞名になります。それ以外は、茶筌
の出力に依存していますので、茶筌の辞書次第ですね。
> 専門用語とそれ以外、さらに専門用語も分野別に分類して解析
これは、具体的にどういった解析をお考えでしょうか? 例えば特定分野の専
門用語のみを対象として、共起ネットワークやクラスター分析等の多変量解析
を行うといった形でしょうか?
もしそういうことであれば、コーディングルールを使って、特定分野の専門用
語を拾われる方が、茶筌の辞書を触るよりは楽かと思います。
例えば、「分野A.txt」というテキストファイルに以下のように記述します。
----------------------------------------------------------------------
*用語1
用語1
*用語2
用語2
*用語3
用語3
----------------------------------------------------------------------
※用語はすべて、分野Aの専門用語とします。
そして、「分野A.txt」をコーディングルール・ファイルとして指定し、共起
ネットワーク等の作成を行います(「ツール」→「コーディング」→「共起
ネットワーク」)。これによって、分野Aの専門用語だけを用いた解析を行え
ます。
もちろん茶筌の辞書を編集することも可能ですが、上記のような用途であれば、
おそらくコーディングルールを使った方が効率的かと思います。
以上、お節介かとは思いましたが、老婆心までに。