はてぶの情報から得たユーザ間の類似度をJungで描画

データ

はてぶのタグ情報からJaccard係数(っぽいもの)を用いて抽出した類似度(100ユーザ分)

グラフ


離れている4人のユーザが少し気になるので詳しく調べたい。

ソース

下記参考ページとほとんど同じ。
以下に変更点を示す。

  1. 閾値を0.2から0.8に(サンプルは相関係数であるため閾値が低い)

グラフを見てわかる通り今の状態ではまだまだ近さがわかりずらいのでもう少しいじりたい。