데이터 공부기록

Mean Subtraction, 본문

카테고리 없음

Mean Subtraction,

standingR 2023. 10. 4. 17:05

Mean subtraction  = 분산 

x := x − μ

요약하면, 데이터를 평균을 0으로 만들면 데이터를 비교하기가 쉽고, 다양한 범위의 데이터를 효과적으로 다룰 있으며, 이상치에 민감하지 않게 됩니다. 이렇게 데이터를 가공하면 머신 러닝 모델을 훈련시키고 데이터 분석을 정확하게 수행할 있게 됩니다.

 

 

수학적 접근

1.편차(각 원소의 값-평균값/하는 이유->평균에서 얼마만큼 떨어져 있는가!)

 

어떤 자료들 간의 값 차이가 클 떄 '편차가 크다'라는 말을 많이 사용한다.

통계에서 편차란, 관측치 (개별 자료)와 전체 자료의 평균(전체 자료 집합) 차이를 의미한다.

쉽게 말하자면, 개별 자료가 평균으로 부터 얼마만큼 떨어져 있는가를 나타내는 값이 "편차" 이다. (-평균에서 얼마만큼 떨어져 있는가.)

 

편차의 식

# Mean Subtraction
# 1. 점수의 평균을 구합니다  2.평균을 구한뒤에 각 수에 빼줍니다. 3.그 수들의 평균을 구합니다.

score1 = 10
score2 = 20
score3 = 30
n_student = 3

mean_score = (score1 + score2 + score3)/n_student
print(mean_score)

score1 -= mean_score
score2 -= mean_score
score3 -= mean_score

mean_score = (score1 + score2 + score3)/n_student
print(mean_score)