Main/통계

📊상관분석(Correlation Analysis) #1 기본 개념 완벽 정리!

research_notes 2022. 7. 20. 11:41
728x90
반응형

상관분석은 데이터를 다룰 때 자주 접하게 되는 통계 기법 중 하나입니다.
하지만 막상 사용하려고 하면 “상관계수?”, “피어슨 vs 스피어만?”, “인과관계랑 다른 거야?” 같은 의문이 생기곤 하죠.

이번 글에서는 상관관계의 개념부터 상관계수의 해석까지, 꼭 알아야 할 기본 개념을 정리해드릴게요.

 

1️⃣ Correlation (상관관계)란?

상관관계는 한 변수가 변화할 때, 다른 변수가 어떤 방향으로 어떻게 변하는지를 나타내는 통계 지표입니다.
즉, 두 변수가 동시에 움직이는 정도를 의미합니다.

📌 “상관관계는 선형적인 관계를 측정한다”
→ 두 변수 간의 변화가 직선 형태로 함께 움직이는지를 보는 것

예시:

  • 키가 클수록 몸무게도 증가한다 → 양(+)의 상관관계
  • 스트레스가 높을수록 수면 시간이 줄어든다 → 음(-)의 상관관계

⚠️ 주의!
상관관계가 있다고 해서 **원인과 결과(인과관계)**가 있는 것은 아닙니다!

 

2️⃣ Correlation Analysis (상관분석)이란?

상관분석은 두 변수 사이의 선형적 관계의 강도와 방향을 분석하는 통계 기법입니다.
이 분석을 통해 우리가 알고 싶은 것은,

“변수 A가 커질수록 변수 B는 어떻게 변화하는가?”

상관분석은 상관계수를 계산하여, 수치적으로 그 관계를 파악합니다.

✔️ 선형 관계만 측정 가능 → **산점도(Scatter Plot)**와 함께 활용하면 더 정확한 해석 가능

📌 산점도란?
: 두 변수 (x, y)를 좌표 위에 점으로 찍어 시각적으로 관계를 보여주는 그래프입니다.

 

3️⃣ Correlation Coefficient (상관계수)란?

상관계수는 두 변수 간의 관계를 수치로 나타낸 지표입니다.
-1부터 +1까지의 값을 가지며, 다음과 같이 해석됩니다:

상관계수 값의미
-1 완벽한 음의 상관관계 (한 변수가 증가할수록 다른 변수는 일정하게 감소)
0 상관 없음 (변수 간에 아무런 패턴이 없음)
+1 완벽한 양의 상관관계 (두 변수가 함께 증가 또는 감소)
 

✔️ 상관계수의 방향 (+ / -)

  • + : 두 변수는 같은 방향으로 움직임  /  - : 두 변수는 반대 방향으로 움직임
  • 상관계수가 -1일 때 = 완벽한 음의 상관관계 
  • 상관계수가 0일 때 = 아무런 관계도 없다는 뜻 
  • 상관계수가 +1일 때 = 완벽한 양의 상관관계 

✔️ 상관계수의 크기 (절댓값)

  • 1에 가까울수록 → 변수들이 강하게 연결되어 있음 (데이터 점들이 서로 잘 모여 있음)
  • 0에 가까울수록 → 변수들 사이에 연관성이 거의 없음 (데이터 점들이 서로 흩어짐)
  • 상관계수의 크기는 힘을 의미

 

📌 요약 정리

개념설명
상관관계 두 변수가 함께 움직이는 정도 (동시 변화)
상관분석 상관관계를 수치화하여 분석하는 방법
상관계수 -1 ~ +1 사이의 수치로, 관계의 방향과 강도를 나타냄
산점도 변수 간의 관계를 시각화하는 그래프
주의 상관관계 ≠ 인과관계, 상관계수 ≠ 기울기
 

📘 [상관분석 #2] 상관계수의 종류 (피어슨, 스피어만, 켄달 등)
각 상관계수가 언제, 왜, 어떻게 쓰이는지 궁금하시다면 아래 포스트를 확인해주세요!

 

2022.07.20 - [Main/통계] - 상관분석 (Correlation Analysis) #2 Type of Correlation Coefficient

 

상관분석 (Correlation Analysis) #2 Type of Correlation Coefficient

상관계수의 종류 (Types of Correlation Coefficient) : You can choose from many different correlation coefficients based on the linearity of the relationship, the level of measurement of your variables, and the distribution of your data. 1. 피어슨

kimtutor.tistory.com

2022.07.20 - [Main/통계] - 📈 상관분석 #3: 상관계수와 p-value, 헷갈리지 마세요!

 

📈 상관분석 #3: 상관계수와 p-value, 헷갈리지 마세요!

통계 분석을 처음 접하는 분들이 자주 혼동하는 개념 중 하나가 바로,**상관계수(correlation coefficient)**와 **p-value(유의 확률)**입니다.두 값은 상관분석에서 자주 함께 나타나지만, 완전히 다른 의

kimtutor.tistory.com

 

 

출처: Scribbr.com/statistics/correlation-coefficient, 네이버 지식백과, 구글

728x90
반응형