[掲示板へもどる]
一括表示

  [No.3404] スペースを含む固有名詞について 投稿者:Anti  投稿日:2017/12/26(Tue) 13:03:23

スペースを含む固有名詞を語とするにはどうすればよろしいでしょうか?
例えば「American Express」や「GINZA SIX」などです。
「前処理」「語の取捨選択」に「American Express」、「'American Express'」、「"American Express"」とかは、試してみました。また全角指定も同様に試しましたが、スペースで分割されてしまいます。


  [No.3408] Re: スペースを含む固有名詞について 投稿者:HIGUCHI Koichi  投稿日:2017/12/27(Wed) 01:27:31

こんにちは、樋口です。書き込みありがとうございます。

「American Express」を、「語の取捨選択」画面の強制抽出欄に入れてか
ら、前処理をもう一度実行すればそれで良いはずですが、だめでしょうか。

前処理を再度実行していますか?


  [No.3409] Re: スペースを含む固有名詞について 投稿者:Anti  投稿日:2017/12/27(Wed) 09:00:03

お忙しいところご返信いただきありがとうございます。
「語の取捨選択」に直接「American Express」と入れるパターンと、「ファイルから読み込み」するパターンを試してみました。それぞれ、前処理の実行をしています。そして「抽出リスト」から「品詞別」で抽出すると、「未知語」列に「American」と「Express」に分割されています。「階層的クラスター分析」で表示しても分割されています。

■具体的には強制抽出には以下のように指定しました。
American Express
'American Express'
"American Express"
American Express
'American Express'
"American Express"


Version: 3.Alpha.11a[Perl 5.14.2,Perl/Tk 804.03]
Windows10


  [No.3410] Re: スペースを含む固有名詞について 投稿者:HIGUCHI Koichi  投稿日:2017/12/27(Wed) 11:47:05

こんにちは、樋口です。書き込みありがとうございます。

データは日本語でしょうか? マニュアルの片隅にしか書いていなくて分かり
にくいのですが、日本語データの場合、テキスト中の半角スペースはすべて全
角に変換されてしまいます。

このため「American Express」ではなく、「American Express」(スペース
は全角)と強制抽出欄に入力する必要があります。

※あまりに分かりにくいので、日本語データの場合、強制抽出欄に半角スペー
スが入力されている場合、全角に自動変換するように次のバージョンでは改め
ます。


  [No.3411] Re: スペースを含む固有名詞について 投稿者:Anti  投稿日:2017/12/27(Wed) 16:54:09

早速ご回答いただき、ありがとうございます。
ご指摘の通り半角スペースを全角にすることで、解決いたしました。
こんなに早く解決していただき感謝いたします。
ありがとうございました。