こんにちは、樋口です。書き込みありがとうございます。同順1位の場合、選択の基準は特に指定していません。強いて言えば、Rのソート関数が出力した順番ですが、これがどういう順番かはよく分かりません(調べていません)。同順1位がある語、すなわちcheck列に1になっている語は、現状では一意に分類することには失敗しているというところです。check列に1がある場合は、jaccard係数以外の基準を加味して判断するような処理が必要かもしれません。