일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 통계용어 정리
- ㅂ.
- 새싹 AI데이터새싹 엔지니어 부트캠프 2일차
- X
- ai 새싹 부트캠프 4일차
- 데이터분석가
- 새싹 AI데이터새싹 엔지니어 부트캠프 1일차
- 데이터분석가면접준비
- Til
- T
- ai 새싹 부트캠프 6일차
- 새싹 AI데이터새싹 엔지니어 부트캠프
- ai 새싹 부트캠프 7일차
- ai 새싹 부트캠프 5일차
- 데이터관련면접
- 취준생
- ASAC
- 새싹 AI데이터새싹 엔지니어 부트캠프 3일차
- Today
- Total
목록데이터분석가 (2)
데이터 공부기록

통계 용어정리 1-1) 모평균 - Population mean(모평균)은 모집단의 모든 개체의 값을 합하여 전체 개체 수로 나눈 값입니다. - poplution mean = 모집단 평균 - sum of each value in the popultaion = 모집단의 각 값의 합 - number of values in the poplution = 모집단 값의 수 -수학적 표현 1-2) 표본 평균 모집단에서 일부를 뽑아 그값들의 평균을 구한 것, 표본 평균은 다음과 같이 표현된다. - 수학적 표현 중앙값 (Median): 주어진 데이터를 크기 순서대로 정렬했을 때, 가운데에 위치한 값이다. 이상치의 영향을 덜 받기 때문에 데이터의 중심 경향성을 평가할 때 평균 대신 중앙값을 사용하기도 한다. 분산 (Vari..

0. 들어가기에 앞서 0-1 ' 아무리 재주가 좋은 부인이라도 쌀이없으면, 밥을 지을 수 없다.' ML 에서 Data 와 Featrue는 쌀에 해당하고, Model 과 algorithm은 '부인'에 해당한다. 충분한 Data 와 Featrue가 없다면 아무리 좋은 Model 구조를 가졌다고 해도, 만족할만한 결과를 얻을 수 없다. = [Garbage in, garbage out] 0-2 피처 엔지니어링 이란, 이름에서 알수 있듯이 최초 데이터에 대해 일련의 공정 처리를 가해 피처로 만들어 알고리즘과 모델에서 INPUT(입력) 값으로 사용하는 것 본질적으로 피처 엔지니어링은 데이터를 표현하는 과정, 더 실용적인 관점에서 본다면, 피처 엔지니어링의 목적은 데이터의 Noise와 잉여 성분을 제거하고 더 효율적..