728x90
반응형
**회귀분석(Regression Analysis)**은 변수 간의 관계를 수치적으로 설명하고 예측하는 통계 기법입니다.
특히, 독립변수가 종속변수에 미치는 영향을 파악하거나 미래 값을 예측하는 데 강력한 도구로 쓰입니다.
이번 포스트에서는 회귀분석의 대표적인 유형들을 구체적인 예시와 함께 정리해보겠습니다.
✅ 1. 단순선형 회귀분석 (Simple Linear Regression)
- 정의: 독립변수(x)와 종속변수(y)가 1개씩 존재하며, 두 변수 간의 관계가 직선(선형) 형태로 표현됩니다.
- 조건: 변수들이 서로 선형적(linear)으로 연결되어 있어야 함
- 용도: 한 개의 독립변수로 종속변수를 예측할 때 사용
📌 예시
구매만족도가 재구매의도에 어떤 영향을 주는가?
y = a + bx
- y: 재구매의도
- x: 구매만족도
- a, b: 회귀계수
✅ 2. 다중선형 회귀분석 (Multiple Linear Regression)
- 정의: 독립변수가 2개 이상일 때 사용. 여전히 선형 형태를 유지함.
- 특징: 독립변수는 연속형 또는 범주형 모두 가능
- 용도: 여러 요인이 종속변수에 영향을 줄 때 적합
📌 예시
구매만족도, 직원 친절도가 재구매의도에 어떤 영향을 미치는가?
y = a + b1x1 + b2x2 + … + bnxn

✅ 3. 로지스틱 회귀분석 (Logistic Regression)
- 정의: **종속변수가 범주형(categorical)**일 때 사용하는 회귀분석
- 특징: 결과값이 0 또는 1 같은 이진(binary) 값으로 나옴 (ex. Pass/Fail, True/False, 0/1)
- 모델 형태: S자형 곡선 (sigmoid 함수 사용)(S-shaped curve)을 사용함
📌 예시
고객이 상품을 재구매할지 안 할지 (Yes/No, 1/0)
시험에 합격할지 떨어질지 (Pass/Fail)
P(y=1) = 1 / (1 + e^-(a + bx))

✅ 4. 다항 회귀분석 (Polynomial Regression)
- 정의: **비선형 관계(non-linear)**를 설명하기 위한 회귀분석
- 특징: 선형 회귀의 확장형으로, 독립변수에 제곱, 세제곱 항이 포함됨
- **곡선 형태의 회귀선(fitted curve)**을 만듦
📌 예시
온도 변화가 에너지 소비량에 미치는 영향
광고 집행 시간이 증가함에 따라 매출 증가 → 일정 시점 이후 포화되는 패턴

✅ 5. 콕스 비례 회귀분석 (Cox Proportional Hazards Regression)
- 정의: **생존분석(Survival Analysis)**에서 사용되는 회귀모형
- 용도: 사망, 질병, 실패 등 특정 사건이 발생할 때까지의 시간 분석
- 특징: 시간의 흐름에 따라 어떤 요인이 사건 발생 확률에 영향을 주는지 분석
📌 예시
난소암 환자의 생존 기간에 영향을 미치는 요인(예: 연령, 치료 방식 등)을 분석

🧾 회귀분석 비교 요약표
회귀 유형독립변수종속변수관계 형태사용 예시
단순선형 회귀 | 1개 | 1개 | 선형 | 구매만족도 → 재구매의도 |
다중선형 회귀 | 2개 이상 | 1개 | 선형 | 만족도 + 친절도 → 재구매 |
로지스틱 회귀 | 1개 이상 | 범주형 (0/1) | 비선형 (S-curve) | 고객 이탈 여부, 합격 여부 |
다항 회귀 | 1개 이상 | 1개 | 비선형 (곡선) | 온도 → 소비량 |
Cox 회귀 | 1개 이상 | 생존시간 | 비례위험모형 | 치료군 → 생존율 분석 |
728x90
반응형
'Main > 통계' 카테고리의 다른 글
분산분석 (ANOVA) #2 가정 및 이유 (0) | 2022.08.19 |
---|---|
분산 분석 (ANOVA) #1 분산분석이란? (0) | 2022.08.17 |
회귀분석 (Regression Analysis) #1 회귀분석이란? (0) | 2022.08.10 |
T 검정 (t-test) #2 T검정 종류 (Types of t-test) (0) | 2022.08.04 |
T-검정 (t-test) #1 t 검정이란? (0) | 2022.08.04 |