樋口先生
早速のご回答ありがとうございます!
まず掲示板の過去ログを参照する前にマニュアルを一通り眺めるべきでした...
申し訳ございません。
入力形態素データには活用情報だけでなくて"読み"情報もなかったりするのですが、
KH coderの主機能を拝見する限りでは使用されていないようですので、NULか
形態素自体のコピーで埋めればいいものと理解しております(間違っていましたらご指摘ください)。
入力する形態素データは1形態素1レコードでして、文章ID(S/N)、文ID(S/N)、文中での登場順が位置情報変数として含まれておりますが、
1)文章全体の順番を再現するように位置情報変数を使ってソート
2)ChaSenの仕様に従って句点・EOSで文および段落を分離、さらに必要であればタグによってより大きな構造を分離
というプロセスによってパースすればそのままKH coderの機能が使えるような気がしてきました。
あとこちらが用意する形態素データの品詞分類とChaSenの品詞分類が異なることによって
品詞選択モードの動作がどうなるのかわからないのですが(データからダイナミックに
生成されていればありがたいのですが...)簡単な実験をして確かめてみます。
だいぶ実現に近づいた気がいたします、ありがとうございました。
詳細なセッティングをしていく段階で不明点が出てくるかもしれませんが、その際には
また質問させてください。