본문 바로가기
Main/통계

📊 회귀분석 (Regression Analysis) #2 – 회귀분석의 종류와 활용 예시 완전 정리!

by research_notes 2022. 8. 10.
728x90
반응형

 

**회귀분석(Regression Analysis)**은 변수 간의 관계를 수치적으로 설명하고 예측하는 통계 기법입니다.
특히, 독립변수가 종속변수에 미치는 영향을 파악하거나 미래 값을 예측하는 데 강력한 도구로 쓰입니다.

이번 포스트에서는 회귀분석의 대표적인 유형들을 구체적인 예시와 함께 정리해보겠습니다.


✅ 1. 단순선형 회귀분석 (Simple Linear Regression)

  • 정의: 독립변수(x)와 종속변수(y)가 1개씩 존재하며, 두 변수 간의 관계가 직선(선형) 형태로 표현됩니다.
  • 조건: 변수들이 서로 선형적(linear)으로 연결되어 있어야 함
  • 용도: 한 개의 독립변수로 종속변수를 예측할 때 사용

📌 예시

구매만족도가 재구매의도에 어떤 영향을 주는가?

y = a + bx

 

  • y: 재구매의도
  • x: 구매만족도
  • a, b: 회귀계수

 


✅ 2. 다중선형 회귀분석 (Multiple Linear Regression)

  • 정의: 독립변수가 2개 이상일 때 사용. 여전히 선형 형태를 유지함.
  • 특징: 독립변수는 연속형 또는 범주형 모두 가능
  • 용도: 여러 요인이 종속변수에 영향을 줄 때 적합

📌 예시

구매만족도, 직원 친절도가 재구매의도에 어떤 영향을 미치는가?

y = a + b1x1 + b2x2 + … + bnxn

https://www.keboola.com/blog/linear-regression-machine-learning


✅ 3. 로지스틱 회귀분석 (Logistic Regression)

  • 정의: **종속변수가 범주형(categorical)**일 때 사용하는 회귀분석
  • 특징: 결과값이 0 또는 1 같은 이진(binary) 값으로 나옴 (ex. Pass/Fail, True/False, 0/1)
  • 모델 형태: S자형 곡선 (sigmoid 함수 사용)(S-shaped curve)을 사용함

📌 예시

고객이 상품을 재구매할지 안 할지 (Yes/No, 1/0)
시험에 합격할지 떨어질지 (Pass/Fail)

P(y=1) = 1 / (1 + e^-(a + bx))

 


✅ 4. 다항 회귀분석 (Polynomial Regression)

  • 정의: **비선형 관계(non-linear)**를 설명하기 위한 회귀분석
  • 특징: 선형 회귀의 확장형으로, 독립변수에 제곱, 세제곱 항이 포함됨
  • **곡선 형태의 회귀선(fitted curve)**을 만듦

📌 예시

온도 변화가 에너지 소비량에 미치는 영향
광고 집행 시간이 증가함에 따라 매출 증가 → 일정 시점 이후 포화되는 패턴


✅ 5. 콕스 비례 회귀분석 (Cox Proportional Hazards Regression)

  • 정의: **생존분석(Survival Analysis)**에서 사용되는 회귀모형
  • 용도: 사망, 질병, 실패 등 특정 사건이 발생할 때까지의 시간 분석
  • 특징: 시간의 흐름에 따라 어떤 요인이 사건 발생 확률에 영향을 주는지 분석

📌 예시

난소암 환자의 생존 기간에 영향을 미치는 요인(예: 연령, 치료 방식 등)을 분석

 

https://www.medcalc.org/manual/cox-regression.php

🧾 회귀분석 비교 요약표

회귀 유형독립변수종속변수관계 형태사용 예시
단순선형 회귀 1개 1개 선형 구매만족도 → 재구매의도
다중선형 회귀 2개 이상 1개 선형 만족도 + 친절도 → 재구매
로지스틱 회귀 1개 이상 범주형 (0/1) 비선형 (S-curve) 고객 이탈 여부, 합격 여부
다항 회귀 1개 이상 1개 비선형 (곡선) 온도 → 소비량
Cox 회귀 1개 이상 생존시간 비례위험모형 치료군 → 생존율 분석
728x90
반응형