タグを用いて求めたユーザ間類似度をjungで描画(正しいバージョン)
なんと!!
タグを用いて求めたユーザ間類似度をjungで描画 - 研究とプログラミングメモ by LNCTで示した図は正しい類似度を用いていなかったことに気付く.数値の妥当性をあまり考えていなかったようだ.
原因は「aの2乗」を「a^2」と書いていたため(この書き方はダメなのか?).
すぐさま修正し,ついでにタグ種類数(T)とBMしているページの数(P)も表示するように拡張も行う.
以下に正しい図を示す.ちなみにCircleLayoutは見づらいからやめた.
[LRLayout]
閾値…0.1 青…0.1~0.2 黄…0.2~0.4 赤…0.4~
考察
- 左下の赤のラインでつながっているユーザはタグ種類数がそれぞれ1と2であった.たまたまそのタグ名が1つ重複していたため高い類似度(0.5)となっている
- それ以外についてはなんともいえない
今後
- 共通タグを除く(個性が出そう?)
- ページごとに算出した類似度も盛り込む
- タグ間類似度の値が大きいユーザ集合に対して
- もしくは,単純にタグ間類似度とページ間類似度を掛け合わせるのもアリかも