카테고리 없음
Mean Subtraction,
standingR
2023. 10. 4. 17:05
Mean subtraction = 분산
x := x − μ
요약하면, 데이터를 평균을 0으로 만들면 데이터를 비교하기가 쉽고, 다양한 범위의 데이터를 효과적으로 다룰 수 있으며, 이상치에 민감하지 않게 됩니다. 이렇게 데이터를 가공하면 머신 러닝 모델을 더 잘 훈련시키고 데이터 분석을 더 정확하게 수행할 수 있게 됩니다.
수학적 접근
1.편차(각 원소의 값-평균값/하는 이유->평균에서 얼마만큼 떨어져 있는가!)
어떤 자료들 간의 값 차이가 클 떄 '편차가 크다'라는 말을 많이 사용한다.
통계에서 편차란, 관측치 (개별 자료)와 전체 자료의 평균(전체 자료 집합)간 차이를 의미한다.
쉽게 말하자면, 개별 자료가 평균으로 부터 얼마만큼 떨어져 있는가를 나타내는 값이 "편차" 이다. (-평균에서 얼마만큼 떨어져 있는가.)
# Mean Subtraction
# 1. 점수의 평균을 구합니다 2.평균을 구한뒤에 각 수에 빼줍니다. 3.그 수들의 평균을 구합니다.
score1 = 10
score2 = 20
score3 = 30
n_student = 3
mean_score = (score1 + score2 + score3)/n_student
print(mean_score)
score1 -= mean_score
score2 -= mean_score
score3 -= mean_score
mean_score = (score1 + score2 + score3)/n_student
print(mean_score)