728x90
반응형
회귀분석 (Regression Analysis)
: 독립변수(independent variable)가 종속변수(dependent variable)에 미치는 영향을 확인하고자 사용하는 분석방법.
- 회귀 (regression): "어딘가로 돌아감을 의미"
- 평균으로의 회귀 (regression toward the mean)
- 회귀분석의 목적: 독립변인(X)으로 종속변인(Y)를 예측하기 위해 (predicting the effect of an independent variable on the dependent variable)
- 독립변수 (independent variable): 변수의 변화 원인이 모형 밖에 있는 변수
- factors that you hypothesize have an impact on your dependent variable.
- 종속변수 (dependent variable): 변수의 변화 원인이 모형 안에 있을 변수
- the main factor that you’re trying to understand or predict.
- 독립변수 (independent variable): 변수의 변화 원인이 모형 밖에 있는 변수
- 회귀분석의 종류
- 단순회귀 (Simple regression): 독립변수 1개 & 종속변수 1개
- 다중회귀 (Multiple regression): 독립변수 2개 이상 & 종속변수 1개
회귀분석의 예제
- 우산 판매량 (umbrellas sold) & 강우량 (rainfall): 강우량에 따라 우산 판매량이 달라짐 (우산 판매량에 따라 강우량이 변화하는 것이 아님).
- 독립변수 (원인) = 강우량
- 종속변수 (결과) = 우산 판매량
- 분석의 목적
- 만약 강우량이 180 mm이라면, 우산 판매량은 얼마일까? 를 예측하는 것
- 이를 예측하기 위해 필요한 것 = 회귀선 (regression line): 데이터 점들을 가장 잘 설명하는 선을 찾아내는 것.
- y = a + bx + e
- x = 독립변수 / y = 종속변수 / b = 회귀계수 / a = 절편 (intercept) / e = 오차 (측정값 - 예측값)
- 독립변수 x가 1 증가할 때마다 종속변수 y는 b만큼 증가한다.
- 회귀계수는 직선의 기울기(slope)가 된다.
- 가장 합리적인 회귀선 = 오차의 제곱합 최소화된 추세선
출처: youtube > Sa[oemtoa a Dei, 구글, 네이버 지식백과
2022.08.10 - [Main/통계] - 회귀분석 (Regression Analysis) #2 회귀분석 종류
728x90
반응형
'Main > 통계' 카테고리의 다른 글
분산 분석 (ANOVA) #1 분산분석이란? (0) | 2022.08.17 |
---|---|
회귀분석 (Regression Analysis) #2 회귀분석 종류 (0) | 2022.08.10 |
T 검정 (t-test) #2 T검정 종류 (Types of t-test) (0) | 2022.08.04 |
T-검정 (t-test) #1 t 검정이란? (0) | 2022.08.04 |
상관분석 (Correlation Analysis) #3 상관계수와 p-value (0) | 2022.07.20 |