ユークリッド距離とは?
状態:-
閲覧数:1,472
投稿日:2016-04-11
更新日:2016-08-11
空間上の距離
・二次元であれば2点(x1, y1), (x2, y2)間の距離は直角三角形の斜辺の長さを求めるという方式
→ 「平面で成り立つピタゴラスの定理=三平方の定理」を、平面だけではなくや3次元空間や4次元以上でも適用できるよう定義したもの
Euclidean distance
・ユークリッド幾何学が適用される空間の距離
・n次元空間における二点間の距離d
「(2点の座標差の2乗)の和」の平方根
・図形と方程式で2点間の距離を求めるときに、何故ルートにして中身の数字を二乗にするのですか?
・ユークリッド距離とは何なのか教えてください。
・クラスター分析の手法1(概要)
・二次元であれば2点(x1, y1), (x2, y2)間の距離は直角三角形の斜辺の長さを求めるという方式
→ 「平面で成り立つピタゴラスの定理=三平方の定理」を、平面だけではなくや3次元空間や4次元以上でも適用できるよう定義したもの
Euclidean distance
・ユークリッド幾何学が適用される空間の距離
・n次元空間における二点間の距離d
「(2点の座標差の2乗)の和」の平方根
・図形と方程式で2点間の距離を求めるときに、何故ルートにして中身の数字を二乗にするのですか?
・ユークリッド距離とは何なのか教えてください。
・クラスター分析の手法1(概要)
2次元 / 3次元 / n次元
2次元空間の場合
「直角三角形の斜辺の長さを求める」方式で計算可能
各点の座標は、(x、y)と全部で2個で表示
・2点の座標を(x1、y1)と(x2、y2)とすると、
・2点の座標を(xa、ya)と(xb、yb)とすると、
3次元空間の場合
各点の座標は、(x、y、z)と全部で3個で表示
・2点の座標を(xa、ya、za)と(xb、yb、zb)とすると、
n次元空間の場合
各点の座標は、(x、y、z、・・・・・)と全部でn個で表示
距離が近い程0に近づく。距離が遠い程大きくなる。プラス無限大まで
正規化
正規化
「ユークリッド距離式の結果」を0〜1までの数になるよう正規化
類似性を計算する
類似度を表す式
・「2人の評者の評価データの距離の総和を求め、それに1を加えたもの」の逆数を取る
1を加える理由
・2人の評者の評価が完全に一致した場合には距離が0になってしまうので、0での除算を防ぐため
距離が近い
・類似性が高ければ高い程、式の値は大きくなり1へ近づく
距離が離れている
・類似性が低ければ、式の値は小さくなり0へ近づく
・ユークリッド距離を求める
具体例 / 各人が読んだ漫画の評価値を元にして類似スコアを算出
今回用意したデータ
ブラウン
・キャプテン翼:2.5点 北斗の拳:3.5 山田くんと7人の魔女:3.0 君に届け:3.5 となりの柏木さん:2.5 ダメな私に恋してください:3.0
麻由
・キャプテン翼:3.0点 北斗の拳:3.5 山田くんと7人の魔女:1.5 君に届け:5.0 となりの柏木さん:3.5 ダメな私に恋してください:3.0
1.抽出漫画の評価距離を算出し、それらを全て合計
√(2.5-3.0)の2乗 + (3.5-3.5)の2乗 + (3.0-1.5)の2乗 + (3.5-5.0)の2乗 + (2.5-3.5)の2乗 + (3.0-3.0)の2乗
・(2.5-3.0)×(2.5-3.0) + (3.5-3.5)×(3.5-3.5) + (3.0-1.5)×(3.0-1.5) + (3.5-5.0)×(3.5-5.0) + (2.5-3.5)×(2.5-3.5) + (3.0-3.0)×(3.0-3.0)=5.752.上記結果の平方根を算出
√算出した抽出漫画の評価距離の合計
・√5.75=2.39791576166※この時点では、スコアは0~1の間ではない
3.上記のスコアを0~1で表す
上記結果 = 1 / (1 + 上記結果);
・1 / (1 + √5.75) = 0.29429805508