コサイン距離ベースのLSHをRubyで - gnarl、技術メモ’”%s¥

screenshot

雑記参考文献:Web+DB press vol.49 レコメンド特集のPart3など。アルゴリズムの概要詳細(特に数学的な)はぐぐれ。モチベーションとしては、高次元における近傍点探索を高速で行いたい。まじめにやるとどう工夫しても計算量がすごいことになるので、近似で。どうするかというと、「距離が近いと同じような値になるハッシュ関数」を使う。あるベクトルの近傍を求めたい場合、そのベクトルのハッシュと同...

http://d.hatena.ne.jp/gnarl/20090409/1239288337
http://b.hatena.ne.jp/entry/http://d.hatena.ne.jp/gnarl/20090409/1239288337