데이터 체계화 (Organizing Data)
- 연구의 데이터 수집 단계가 완료되었을 때, 결과는 보통 수많은 숫자들로 구성된다. (measurements)
- 예를 들어, 아래 사진은 200명을 대상으로 한 공복 혈당 수치이다. 정리되지 않은 데이터는 이해하기 어렵다.
- 앞서 #1-1에서 설명된 기술통계(descriptive statistics)가 필요하며, 데이터를 체계화하는 첫 단계가 측정 값이 발생하는 빈도를 확인하는 것(determine how frequently a measurement value occurs)이다.
Frequency Distribution (빈도분포)
: an organized table of the number of scores located in each category on the measurement scale.
: 크기 순서로 모든 값들을 나열한 다음에 각 값이 출현하는 빈도를 집계하는 것.
: 데이터의 패턴이나 모양을 알게 해준다.
- Gives a picture of how the scores are distributed on the measurement scale
- Contains two elements
- Set of categories from the measurement scale
- record of frequency (number) of scores in each category
- Frequency distributions generally take the form of either table of graphs.
** 절대빈도(Absolute Frequency)
--> 빈도 분포에서 각 급간에 대한 빈도
** 상대빈도(Relative Frequency)
--> 절대빈도를 전체 사례수에 대한 비율이나 백분률로 바꾼것.
--> shows the percentage (%) of all the scores that fall within each interval.
Types of Frequency Distribution (빈도분포 유형)
- 빈도분포를 표현할 수 있는 여러가지 방법이 있다.
- 대부분 표(TABLE) 형식과 그래프(GRAPH) 형식을 취한다.
TABLE FORM
- 빈도표 (=도수분포표, Frequency Distributions)
- 위에 그림과 같이 두 개의 열로 구성되며, 하나는 모든 가능한 값을 위한 것, 다른 하나는 그 값이 발생한 빈도를 위한 것이다.
- 묶은 빈도표 (Grouped Frequency Distribution)
- 첫번째 열이 값 대신에 간격 또는 범위로 구성된다.
- 급간 (Class interval): 모든 급간은 동일한 폭(equal class interval)이어야 하며, 가장 높은 점수를 포함하는 급간이 맨 위에 위치하도록 하고, 급간의 폭으로 짝수가 아닌 홀수를 택해야 한다.
- 상대빈도분표(Relative Frequency Distribution)
- 상대빈포로 작성한 빈도분표
- 누가빈도분포(Cumulative Frequency Distribution)
- 그 급간에 포함된 빈도와 그 아래쪽의 모든 점수치들의 빈도를 합친 것.
- 누가상대빈도분포(cumulative relative frequency distribution): it represents the % of scores accumulated as you move up the scale
GRAPH FORM
- 빈도다각형/도수다각형(Frequency Polygon)
- 자료를 일정 크기의 급간으로 묶었을 때, 각 급간 중간점에서 해당 도수를 표시한 후 그 점들을 직선으로 연결한 도표 혹은 그래프. 곡선의 높이가 점수의 빈도를 가리키는 빈도분포이다.
- 막대그래프 (Bar Graph)
- 막대그래프는 범주별 빈도 자료를 범주별로 빈도에 비례하는 길이의 막대로 나타낸 그래프
- for discrete interval/ratio data, or data measured on a nominal/ordinal scale.
- Like histogram, but there are spaces between bars to emphasize separate distinct categories
- 히스토그램 (Histogram)
- 도수분포표의 각 계급의 양 끝 값을 가로축에 표시하고 그 계급의 도수를 세로축에 표시하여 직사각형 모양으로 나타낸 그래프
- 막대그래프와 유사하게 생겼지만 히스토그램은 단지 하나의 변인만을 묘사하며 막대들은 빈틈없이 붙어 있다.
- 파이형도표/원형도표(Pie Chart)
- 전체 자료가 여러개의 카테고리로 분류되어지는 경우, 전체 통계량에 대한 부분의 비율을 하나의 원의 내부에 부채꼴로 구분한 그래프
출처: Youtube > Academic Lesson, 네이버 지식백과, 구글
'Main > Biostatistics' 카테고리의 다른 글
Biostatistics #2-3 (Rank & Percentile, 등수 & 백분위) (0) | 2022.02.08 |
---|---|
Biostatistics #2-2 (Shape of Distribution, 분포의 모양) (0) | 2022.02.05 |
Biostatistics #1-4 (Scales of Measurement) (0) | 2022.02.03 |
Biostatistics #1-3 (Types of Study) (0) | 2022.01.26 |
Biostatistics #1-2 (Types of Variables) (0) | 2022.01.24 |