Main/통계

상관분석 (Correlation Analysis) #1 Correlation Coefficient

research_notes 2022. 7. 20. 11:41
728x90
반응형

1. Correlation (상관관계)

: 한 변수가 다른 변수와 동시에 움직이는 정도를 나타내는 통계적 지수

 (a statistical term describing the degree to which two variables move in coordination with one another)

  - 두 변수 간 직선관계 (linear relationship)을 나타낸다.

 

 

2. Correlation Analysis (상관분석)

: 두 변수간에 어떤 선형적 관계를 가지는지 분석하는 기법으로 상관계수를 이용하여 측정한다.

 (a statistical method used to measure the strength of the linear relationship between two variables and compute their  association)

- "상관관계로 원인-결과(인과관계)를 설명할 수 없다"

- 상관계수는 선형 또는 단순 관계만 측정하기 때문에, 산점도(scatter plot)를 사용하여 변수 간의 관계를 조사하는 것이 좋다. 

*산점도(scatter plot): 두 변량 x, y의 순서쌍 (x,y)를 좌표평면 위에 점으로 나타낸 그림.

 

 

3. Correlation Coefficient (상관계수)

: 상관관계를 표현하는 통계적 수치를 말하며, -1에서 +1까지의 값을 가지고 상관관계가 0이면 두 변량은 서로 독립적이며 아무런 영향을 미치지 않는다. 

 (a number between -1 and +1 that tells you the strength and direction of a relationship between variables)

 (in other words, it reflects how similar the measurements of two or more variables are across a dataset)

  • 상관계수의 + / -  방향을 의미
    • 상관계수가 -1일 때 = 완벽한 음의 상관관계 (Perfect negative correlation: when one variable changes, the other variable changes in the same direction.)
    • 상관계수가 0일 때 = 아무런 관계도 없다는 뜻 (Zero correlation: there is no relationship between the variables.)
    • 상관계수가 +1일 때 = 완벽한 양의 상관관계 (Perfect positive correlation: When one variable changes, the other variable changes in the opposite direction.)

  • 상관계수의 크기는 힘을 의미
    • 상관계수의 절대값이 클수록 (1에 가까울수록) 힘이 세다 = 데이터들이 서로 모여있음.
    • 상관계수의 절대값이 작을수록 (0에 가까울수록) 힘이 약하다 = 데이터들이 서로 흩어져있음.
    • 즉, 데이터를 산점도로 그렸을 때, 데이터들이 서로 가깝게 모여있으면 상관관계가 높고, 데이터들이 퍼져 있으면 상관관계가 낮음. 
    • 보통 상관계수의 각도가 상관계수의 값과는 관련이 없다. 상관관계는 점들이 얼마나 모여있는지를 의미하는 것이지 점이 이루는 선의 각도와는 전혀 무관함.
    • The steepness or slope of the line isn't related to the correlation coefficient value. The correlation coefficient doesn't help you predict how much one variable will change based on a given change in the other because two datasets with the same correlation coefficient value can have lines with very different slopes.

 

2022.07.20 - [Main/통계] - 상관분석 (Correlation Analysis) #2 Type of Correlation Coefficient

 

상관분석 (Correlation Analysis) #2 Type of Correlation Coefficient

상관계수의 종류 (Types of Correlation Coefficient) : You can choose from many different correlation coefficients based on the linearity of the relationship, the level of measurement of your variables, and the distribution of your data. 1. 피어슨

kimtutor.tistory.com

 

 

 

 

출처: Scribbr.com/statistics/correlation-coefficient, 네이버 지식백과, 구글

 

728x90
반응형