[掲示板へもどる]
一括表示

  [No.3722] 言葉の分け方 投稿者:   投稿日:2018/06/26(Tue) 17:05:23

お問い合わせします。
KH Coderので一つの単語が段落で分けられていたら認識できないでしょうか?

■お使いのKH Coderのバージョン
3.Alpha.13c 最新用

■どんなエラー・不具合・問題ですか?

→インターネットとかの単語が「インター」で認識されて確認してみたらインターネットでした。
 おそらく段落で分けられていたようですが、そのようなデータからは言葉が読み取れないでしょうか?


■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
→確認できません。

■お使いのOS
→Windows 7


  [No.3723] Re: 言葉の分け方 投稿者:   投稿日:2018/06/26(Tue) 17:49:33

Re: 言葉の分け方 (画像サイズ: 681×379 148kB)

絵があったほうがいいと思ってまた書きます。

段落の問題だけではなさそうで。。。

「いん」だけではなく主にカタカナで問題が発生しております。

どうすればいいでしょうかね。ㅜㅜ


  [No.3724] Re: 言葉の分け方 投稿者:HIGUCHI Koichi  投稿日:2018/06/26(Tue) 18:12:52

こんにちは、樋口です。書き込みありがとうございます。

「イン」の前後に、改行があったり、スペースがあったりすると、添付してい
ただいた図のようになります。

「デザインルール」なら「デザイン」と「ルール」に分かれるはずです。

ところが分析対象テキストが「デザ インルール」のようになっているため
「デザ」「イン」「ルール」のように分かれたようです。

元のテキストから余分なスペース・改行・その他の制御文字を取り除いていた
だくしかないと思います。

※そうしたデータのクレンジングには、有料プライグインが役立つ場合もある
と思います。ただ、結局は手作業が必用になる、という場合もあるだろうと
思います…。

「文錦クレンジング for KH Coder」
http://www.screen.co.jp/as/products/monkin-main.html


  [No.3725] 強制抽出指定に関して 投稿者:   投稿日:2018/06/28(Thu) 18:04:20

お問い合わせします。
強制抽出を指定する場合、抽出語のリストに入らなくてほかのところでダウンしなければなりませんか?
強制抽出の指定を行ったら抽出語のリストに出てないみたいで書き込みします。

■お使いのKH Coderのバージョン
3.Alpha.13c 最新用

■どんなエラー・不具合・問題ですか?

→強制抽出を指定する場合、抽出語のリストにその強制抽出した単語が入っているのか?


■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
→確認できません。

■お使いのOS
→Windows 7


  [No.3728] Re: 強制抽出指定に関して 投稿者:HIGUCHI Koichi  投稿日:2018/06/28(Thu) 22:15:45

こんにちは、樋口です。書き込みありがとうございます。

強制抽出した語も、通常の語と同じように、抽出語リストにあらわれるはずで
す。品詞名は「タグ」となります。

なお、強制抽出の指定をした後、前処理を再度実行する必要がある点にご注意
ください。前処理を実行しないと、指定が反映されません。