備忘録

物忘れが酷いので

jaccard係数?tanimoto係数?

サンプルの類似性を比較するために使います

jaccard係数

A,Bを集合として、

J(A,B)=\frac{|A \cap B|}{|A \cup B|}

で与えられます。

jaccard距離は

d_j(A,B)=1-J(A,B)=\frac{|A \cup B|-|A \cap B|}{|A \cup B|}

詳しくは

http://en.wikipedia.org/wiki/Jaccard_index