[掲示板へもどる]
一括表示

  [No.1783] 前処理エラーにつきまして 投稿者:   投稿日:2014/08/11(Mon) 04:19:49

樋口先生、

はじめまして。政治学でKH Coderを利用した分析を試みています。
表題のエラーについて、.textファイルに前処理をかけた結果、以下のようなエラーが出ます。

「bun_r」テーブル作成中にデータの整合性が失われました。
KH Coderを終了します。

.textファイル内のドキュメントは英語のものです。元のドキュメントの性格上、H1-H5のタグを多用しています。どのような原因があると推測可能でしょうか。やはり、.textファイル上の問題でしょうか。
※現在、KH CoderをMac内仮想Windows上で動かしています。

お忙しいとは思いますが、よろしくお願いいたします。


  [No.1784] Re: 前処理エラーにつきまして 投稿者:HIGUCHI Koichi  投稿日:2014/08/11(Mon) 10:10:12

こんにちは、樋口です。書き込みありがとうございます。

もっともあり得そうなこととして考えられるのは、タグの入力ミスや、タグの
付け方がKH Coderの想定にあってないといったことでしょうか。

KH Coderの想定については、マニュアルのA.2.1節をご確認下さい。なお、H1
やH2など、複数種類のタグを使われるよりは、外部変数をお使いになった方が
簡単かもしれません。
http://www.slideshare.net/khcoder/data-preparation-for-kh-coder

タグの入力ミスについては、いったん語の取り出し設定を「茶筌」に戻した上
で、「分析対象ファイルのチェック」を実行されると、何か分かるかもしれま
せん。


  [No.1785] Re: 前処理エラーにつきまして 投稿者:   投稿日:2014/08/11(Mon) 12:40:47

早速のお返事ありがとうございます。外部変数も試してみしてみます。
「茶茎」に戻す措置は、英語ファイルでも利用可能なのでしょうか。
引き続きよろしくお願いいたします。


  [No.1786] Re: 前処理エラーにつきまして 投稿者:HIGUCHI Koichi  投稿日:2014/08/11(Mon) 12:48:20

こんにちは、樋口です。書き込みありがとうございます。

> 「茶筌」に戻す措置は、英語ファイルでも利用可能なのでしょうか。

はい、可能です。

「分析対象ファイルのチェック」を実行するためだけに、一時的に「茶筌」に
設定するということです。

「分析対象ファイルのチェック」を実行したら、前処理の前にLemmatization
に戻してください。


  [No.1787] Re: 前処理エラーにつきまして 投稿者:   投稿日:2014/08/11(Mon) 13:20:43

お返事ありがとうございます。
「茶茎」の利用でひとまず解決されました。
引き続きよろしくお願いします。