[掲示板へもどる]
一括表示

  [No.3837] 品詞別語彙抽出について 投稿者:坂本  投稿日:2018/10/15(Mon) 23:03:23



■KH Coderのバージョン
         3.Alpha.14
■OS
         Windows 7

樋口先生

はじめまして。
私、現在韓国の方で、勉強している坂本秀文と申します。
先生のプログラムを使用し、学位論文を準備しておりますが、
今日中間発表があり、そこで指摘されたのが、
品詞別語彙抽出の精度についてです。
何故、論文の核心ともいうべき、プログラムの信頼度についての
言及がないのかということでした。
ciniiなどには先生のプログラムを使用した論文が多々ございますが、
確かにそれについた言及がないように思われました。
「KHCoder による中国特許の分析可能性評価 」では、
分かち書きに対する精度についての評価などを見つけましたが、
それが見つけた全てです。

品詞別エクセル語彙表は文章に対して、全てを網羅しているのでしょうか。
カウントされていないものもあるのでしょうか。お教えいただければ幸いです。


坂本秀文


  [No.3838] Re: 品詞別語彙抽出について 投稿者:HIGUCHI Koichi  投稿日:2018/10/16(Tue) 00:05:15

こんにちは、樋口です。書き込みありがとうございます。

KH Coderが各国語データから語を抽出(品詞判別・形態素解説)するためにど
のプログラムを用いているかは,マニュアルに記載しています。そうしたプロ
グラム(たとえば日本語データの場合は茶筌ないしはMeCab)についての論文等
を探していただけば,精度が報告されているかと思います。

また,そうしたプログラムの出力する品詞名とKH Coder上での品詞名の対応に
ついてもマニュアルに記載しています。