[Algorithm] Before KNN

Notice

Recent Posts

Recent Comments

Link

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

데이터 공부기록

[Algorithm] Before KNN 본문

sesac ai 과정/Algorithm

[Algorithm] Before KNN

standingR 2023. 10. 10. 10:50

KNN classification - Fundamentals

- Measures of similarity

1) Euclidean distance

2차원의 점의 거리를 구하는 방법으로

피타고라스의 정리에서 '대각선'구하는 공식을 사용한다. 구하려는 값을 뺸후의 제곱하여 루트를 씌워서 쓴다.

ㄱ. IN MATH

Euclidean distance method / 자료출처 - 양정원 강사님 자료

ㄴ. Code in Python

def euclidean_distance(pt1, pt2):
  distance = 0
  for i in range(len(pt1)):
    distance += (pt1[i] - pt2[i]) ** 2
  return distance ** 0.5
# print(euclidean_distance([5, 4, 3], [1, 7, 9]))

2) Manhattan distance

Manhattan distance 도 Euclidean distance 와 유사하지만,

각 차원의 차를 제곱해서 사용하는 게 아니라. 바로 그냥 절대값을 바로 합산하는 거다. (대각선을 이용하지 않기 떄문에)

아래 그림에서 처럼 대각선을 이용하지않고, 최단 거리를 간다고 이해하면 된다. (a에서 b로 이동할 때 몇 칸씩 이동하는지 생각하자.)

또한, 앞서 설명한 것 처럼 대각선을 이용하지않기 떄문에, Manhattan distance 는 Euclidean distance보다 항상 크거나 같다.

(Manhattan distance >= Euclidean distance)

ㄱ. IN MATH

출처 -https://hleecaster.com/ml-distance-formula/ 그림(2)출처 - 양정원 강사님 자료

ㄴ. Code in Python

def manhattan_distance(pt1, pt2):
  distance = 0
  for i in range(len(pt1)):
    distance += abs(pt1[i] - pt2[i])
  return distance

Distance Metrics

Euclidean(d12, d5) = 5.4829 Manhattan(d12, d5) = 7.25

Euclidean(d12, d17) = 7.0044 Manhattan(d12, d17) = 7.25

유클리드 거리(Euclidean distance)는 여러 특성에서 발생하는 작은 차이보다는 한 특성에서의 큰 차이에 더 큰 영향을 받습니다.

∙ Decision boundary
∙ boundary between regions of the feature space

in which different target levels will be predicted. ∙ k =1

∙ Advantages
∙ relatively straightforward to update the model

when new labeled instances become available. ∙ k =1

∙ Handling Noisy Data
∙ k-nearest neighbors algorithm ∙ k =3

∙ Handling Noisy Data
∙ k-nearest neighbors algorithm ∙ k =5 /

적절한 k 값을 찾는 것이 중요!

∙ Handling Noisy Data
∙ k-nearest neighbors algorithm ∙ k = 15

∙ Weighted k-nearest neighbors algorithm ∙ k = 21

'sesac ai 과정 > Algorithm' 카테고리의 다른 글

[algorithm] bayes 베이즈 정리 (0)	2023.10.20
[Bayes' Theroem] : UPDATE (0)	2023.10.17
[Algorithm - Decision Tree] - about information entrop (0)	2023.10.12
[Algorithm 공부법] (0)	2023.10.12
[Algorithm - Decision Tree] - (Classification & Regression,Fundamentals, Entropy) (0)	2023.10.12

'sesac ai 과정/Algorithm' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

데이터 공부기록

데이터 공부기록

[Algorithm] Before KNN 본문

[Algorithm] Before KNN

KNN classification - Fundamentals

1) Euclidean distance

2) Manhattan distance

'sesac ai 과정 > Algorithm' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역