読者です 読者をやめる 読者になる 読者になる

タグを用いて求めたユーザ間類似度をjungで描画(正しいバージョン)

研究(SBM)

なんと!!
タグを用いて求めたユーザ間類似度をjungで描画 - 研究とプログラミングメモ by LNCTで示した図は正しい類似度を用いていなかったことに気付く.数値の妥当性をあまり考えていなかったようだ.
原因は「aの2乗」を「a^2」と書いていたため(この書き方はダメなのか?).
すぐさま修正し,ついでにタグ種類数(T)とBMしているページの数(P)も表示するように拡張も行う.

以下に正しい図を示す.ちなみにCircleLayoutは見づらいからやめた.
[LRLayout]

閾値…0.1
青…0.1~0.2
黄…0.2~0.4
赤…0.4~

考察

  • 左下の赤のラインでつながっているユーザはタグ種類数がそれぞれ1と2であった.たまたまそのタグ名が1つ重複していたため高い類似度(0.5)となっている
  • それ以外についてはなんともいえない

今後

  • 共通タグを除く(個性が出そう?)
  • ページごとに算出した類似度も盛り込む
    • タグ間類似度の値が大きいユーザ集合に対して
    • もしくは,単純にタグ間類似度とページ間類似度を掛け合わせるのもアリかも