상관분석 (Correlation Analysis) #1 Correlation Coefficient
1. Correlation (상관관계)
: 한 변수가 다른 변수와 동시에 움직이는 정도를 나타내는 통계적 지수
(a statistical term describing the degree to which two variables move in coordination with one another)
- 두 변수 간 직선관계 (linear relationship)을 나타낸다.
2. Correlation Analysis (상관분석)
: 두 변수간에 어떤 선형적 관계를 가지는지 분석하는 기법으로 상관계수를 이용하여 측정한다.
(a statistical method used to measure the strength of the linear relationship between two variables and compute their association)
- "상관관계로 원인-결과(인과관계)를 설명할 수 없다"
- 상관계수는 선형 또는 단순 관계만 측정하기 때문에, 산점도(scatter plot)를 사용하여 변수 간의 관계를 조사하는 것이 좋다.
*산점도(scatter plot): 두 변량 x, y의 순서쌍 (x,y)를 좌표평면 위에 점으로 나타낸 그림.
3. Correlation Coefficient (상관계수)
: 상관관계를 표현하는 통계적 수치를 말하며, -1에서 +1까지의 값을 가지고 상관관계가 0이면 두 변량은 서로 독립적이며 아무런 영향을 미치지 않는다.
(a number between -1 and +1 that tells you the strength and direction of a relationship between variables)
(in other words, it reflects how similar the measurements of two or more variables are across a dataset)
- 상관계수의 + / - 방향을 의미
- 상관계수가 -1일 때 = 완벽한 음의 상관관계 (Perfect negative correlation: when one variable changes, the other variable changes in the same direction.)
- 상관계수가 0일 때 = 아무런 관계도 없다는 뜻 (Zero correlation: there is no relationship between the variables.)
- 상관계수가 +1일 때 = 완벽한 양의 상관관계 (Perfect positive correlation: When one variable changes, the other variable changes in the opposite direction.)
- 상관계수의 크기는 힘을 의미
- 상관계수의 절대값이 클수록 (1에 가까울수록) 힘이 세다 = 데이터들이 서로 모여있음.
- 상관계수의 절대값이 작을수록 (0에 가까울수록) 힘이 약하다 = 데이터들이 서로 흩어져있음.
- 즉, 데이터를 산점도로 그렸을 때, 데이터들이 서로 가깝게 모여있으면 상관관계가 높고, 데이터들이 퍼져 있으면 상관관계가 낮음.
- 보통 상관계수의 각도가 상관계수의 값과는 관련이 없다. 상관관계는 점들이 얼마나 모여있는지를 의미하는 것이지 점이 이루는 선의 각도와는 전혀 무관함.
- The steepness or slope of the line isn't related to the correlation coefficient value. The correlation coefficient doesn't help you predict how much one variable will change based on a given change in the other because two datasets with the same correlation coefficient value can have lines with very different slopes.
2022.07.20 - [Main/통계] - 상관분석 (Correlation Analysis) #2 Type of Correlation Coefficient
출처: Scribbr.com/statistics/correlation-coefficient, 네이버 지식백과, 구글