[掲示板へもどる]
一括表示

  [No.3221] 3a10i版(Windows版)の相関カラー機能について 投稿者:nekoandcoro  投稿日:2017/10/23(Mon) 12:02:08
3a10i版(Windows版)の相関カラー機能について (画像サイズ: 774×639 46kB)

樋口先生、いつもお世話になっております。

3a10i(Windows版)の相関カラー機能について質問です。

アルファー版の3a10h版頃から気が付いたのですが、同じプロジェクト
を[ツール/抽出語]共起ネットワークの相関カラーを表示させた結果
について、nodeとedgeの配置・カラーの様子が3a10dの頃と少し変わっ
ているように感じます。
=======================
1、「こころ2」で相関カラーした結果が、2017年6月2日版スクリーン
ショットと違っていました。小職の操作や設定条件が間違っているでしょ
うか。
 
 ・[集計単位] 段落、 [edgeの選択]上位60
 ・[カラー表示]出現位置
 ※処理結果を添付しました。

2、もしもカラー表示のロジックをされており、修正内容について
さしつかえなければ、修正ポイントだけでもご教示頂けると幸いです。

===========================


  [No.3223] Re: 3a10i版(Windows版)の相関カラー機能について 投稿者:HIGUCHI Koichi  投稿日:2017/10/24(Tue) 02:27:41

こんにちは、樋口です。書き込みありがとうございます。

ご指摘の6月2日版というのは、こちらのスクリーンショットのことかと思います。
https://twitter.com/khcoder/status/870657651536838656

これはKH Coderではなく、R上でプロトタイプを作成していた時のものでして、
現在のところ、私もKH Coder上では再現ができません。「調整」をクリックして
「描画する共起関係」を「上位90」に、また「背景色を暗め」にするとかなり
似たものになります。ただ、配置はちょっと違いますね。


この機能を最初に公開したのは、2017年の7月18日だと思います。
https://twitter.com/khcoder/status/887352493046251524

これ以降、意図的に変えたという記憶はありません。また7月18日当時のコード
とdiffをとってみましたが、やはり色や配置を変えたという感じではありません
でした。
http://khc.cvs.sourceforge.net/viewvc/khc/core/kh_lib/plotR/network.pm?r1=1.46.2.32&r2=1.46.2.21&pathrev=unicode

要するに、良く分からないということで恐縮なのですが、ひとまずのお返事ま
でにて失礼いたします。


  [No.3224] Re: 3a10i版(Windows版)の相関カラー機能について 投稿者:nekoandcoro  投稿日:2017/10/24(Tue) 12:47:28

樋口先生、いつもお世話になっております。

お忙しいところご返答頂きありがとうございました。
『相関カラー機能』の件について過去バージョンとの対比まで実行して頂き
申し訳ございませんでした。

===================================================
相関カラーの配色が3a10d版と違う原因がわかりました。
===================================================
(原因)
・xlsxファイルの一つの列、その列に対応する行末数十行に、本来、KHCのプロジェクトへ
読み込むべきでない文字列が残存していました。そのために、その列以外の行末には数十列
の不要なNULLセルが配置されました。
・このxlsxファイルで作成したプロジェクトを使ったために、旧版[3a10d]と異なる相関カラー
の処理結果となったと思われます。

-------------------------
(反省)
以下に、KHCにプロジェクトを作成する際に経験した失敗した例をお伝えして
今回の反省とします。

(1)外部変数とテキストを読み込ませるために使用したExcelファイルの形式のうち、
 誤って「EXCELマクロ有効ブック」(拡張子 .xlsm)を使わないこと。

 ※マクロ有効ブックを分析対象ファイルに指定するとエラーが出て読み込めません
  でした。
 ※この場合は他の形式(.csv、.xlsx、xls)に変更する。
 
(2)今回事例のように、Excelで外部変数用の列操作中に誤って、本来のデータ行以外の
 行に空白セルを残存させたままプロジェクトを作成しないこと。
 このプロジェクトで相関カラーを処理してしまった。
 
例) Excel   
A列___B列___C列___分析対象とする列
a1____b1____c1____X1
a2____b2____c2____X1
(空)___(空)__c3____(空)
(空)___(空)__c4____(空)
(空)___(空)__c5____(空)
(空)___(空)__c6____(空)

----------------------------------------------------

以上です。

誤った内容であれば、ご指摘をお願い申し上げます。


  [No.3225] Re: 3a10i版(Windows版)の相関カラー機能について 投稿者:HIGUCHI Koichi  投稿日:2017/10/25(Wed) 18:32:33

こんにちは、樋口です。書き込みありがとうございます。

いえいえ、ご丁寧に恐れ入ります。またTipsをご提供いただいてありがとうご
ざいます。

「出現位置」ないしは「文書番号」が、空白セル(欠損値)によって変化し、
結果として色が変わるということですね。この機能の利用時は、気をつけてい
ただかなくてはいけないようですね。


  [No.3226] ※解決しました。ありがとうございました。 投稿者:nekoandcoro  投稿日:2017/10/26(Thu) 13:04:32

樋口先生

 お言葉を添えて頂き、ありがとうございました。


  [No.3271] (Win/Mac)3a10L版の相関カラーが正常に計算されないプロジェクトの状況が分かりました。 投稿者:nekoandcoro  投稿日:2017/11/14(Tue) 14:08:04

(Win/Mac)3a10L版の相関カラーが正常に計算されないプロジェクトの状況が分かりました。 (画像サイズ: 340×491 40kB)

樋口先生、いつもお世話になっております。

このスレを掲載したあと「相関のある事例なのに”相関カラー”が表示され
ない原因は”空白セル(欠損値)”」のままで良いのかと、気になっており
ました。

本日、状況が把握できたのでお知らせいたします。

--------------------------------------------
<状況> ※添付のサンプルをご覧ください。
1.Sample-1
(1) B列セルのB1:B6範囲の表示形式は、[書式設定/表示形式]で ”数値”に設定
(2) B列以外のセルについてはディフォルト(”標準”)のまま

2.Sample-2
(1) 作業の過程で、A3:D3範囲のセルをコピーして7行から10行へ「書式を選択し
  て貼り付け」

※(1)の操作のあとデータ入力せずに、7行から10行のセルには「空白(欠損値)」
  が残存した。
------------------------------------------

3.結論
 上記の状況では B7:B10範囲に表示形式「数値」のセルが残存しています。
このxlsxファイルで新規作成したプロジェクトを開いて、B項目について[ツール/抽出語
/共起ネットワーク]から「相関カラー」を指定した場合、本来は相関のある事項であるにも
関わらず、相関カラーが表示されませんでした。

 ・Sample-1とSample-2の見かけは同じ
 ・プロジェクトに読み込まれる行数は同じ。
 ・KHCに表示される語数も同じ。

(原因)
 ・B7:B10範囲のセルに設定した表示形式「数値」でした。

(検証)
 ・B7:B10範囲にカラーを設定しても正しく相関カラー表示されます。
 ・B7:B10範囲の表示形式が「標準」では正しく相関カラー表示されます。
 ・Win/Macとも同じです。 


  [No.3273] Re: 前処理完了時には必ず「ケース数」ご確認を 投稿者:HIGUCHI Koichi  投稿日:2017/11/15(Wed) 00:51:55

こんにちは、樋口です。書き込みありがとうございます。

検証していただくのに大変なお手数をおかけし、大変恐縮です。心より感謝申
し上げます。

セルに書式が設定されていると、空白セルなのに、データがあるかのようにKH
Coderに読み込まれてしまうという事象ですね。結果として、特に末尾に多数
こうした行があると、「相関」の計算がおかしくなってしまうことが考えられ
ます。

この事象が発生した場合は、前処理後にメイン画面「文書の単純集計」に表示
される「H5」の「ケース数」が実際より多くなるだろうと思います。

したがって、この事象をチェックするためにも、それ以外のデータ準備に関す
る問題が生じていないかをチェックするためにも、前処理後の「ケース数」チ
ェックは必須と考えられます。

今見返してみるとマニュアル類には書いていなかったようで申し訳ありません
が、この機会に、KH Coderをお使い下さるすべての皆さまに声を大にしてお伝
えしたく存じます。前処理完了時には「ケース数」が意図した数字になってい
るかどうか必ずご確認ください。


なお、Excel読み込みには既存のモジュールを使っていることもあり、この事象
への対策をKH Coder側で行なうのは、残念ながら、少し遠い「今後の課題」に
なると思います。

なにはともあれ、検証していただいてありがとうございました。重ねて御礼申
し上げます。