본문 바로가기
Main/Biostatistics

Biostatistics #2-1 (데이터 체계화, Organizing Data - Frequency Distribution)

by research_notes 2022. 2. 4.
728x90
반응형

데이터 체계화 (Organizing Data)

- 연구의 데이터 수집 단계가 완료되었을 때, 결과는 보통 수많은 숫자들로 구성된다. (measurements)

- 예를 들어, 아래 사진은 200명을 대상으로 한 공복 혈당 수치이다. 정리되지 않은 데이터는 이해하기 어렵다. 

- 앞서 #1-1에서 설명된 기술통계(descriptive statistics)가 필요하며, 데이터를 체계화하는 첫 단계가 측정 값이 발생하는 빈도를 확인하는 것(determine how frequently a measurement value occurs)이다.

Frequency Distribution (빈도분포)

: an organized table of the number of scores located in each category on the measurement scale.

: 크기 순서로 모든 값들을 나열한 다음에 각 값이 출현하는 빈도를 집계하는 것.

: 데이터의 패턴이나 모양을 알게 해준다. 

  • Gives a picture of how the scores are distributed on the measurement scale
  • Contains two elements
    • Set of categories from the measurement scale
    • record of frequency (number) of scores in each category
  • Frequency distributions generally take the form of either table of graphs.

** 절대빈도(Absolute Frequency)

--> 빈도 분포에서 각 급간에 대한 빈도

** 상대빈도(Relative Frequency)

--> 절대빈도를 전체 사례수에 대한 비율이나 백분률로 바꾼것.

--> shows the percentage (%) of all the scores that fall within each interval. 

 


Types of Frequency Distribution (빈도분포 유형)

- 빈도분포를 표현할 수 있는 여러가지 방법이 있다. 

- 대부분 표(TABLE) 형식과 그래프(GRAPH) 형식을 취한다.

 

TABLE FORM

  • 빈도표 (=도수분포표, Frequency Distributions)
    • 위에 그림과 같이 두 개의 열로 구성되며, 하나는 모든 가능한 값을 위한 것, 다른 하나는 그 값이 발생한 빈도를 위한 것이다.
  • 묶은 빈도표 (Grouped Frequency Distribution)
    • 첫번째 열이 값 대신에 간격 또는 범위로 구성된다.
    • 급간 (Class interval): 모든 급간은 동일한 폭(equal class interval)이어야 하며, 가장 높은 점수를 포함하는 급간이 맨 위에 위치하도록 하고, 급간의 폭으로 짝수가 아닌 홀수를 택해야 한다.  

  • 상대빈도분표(Relative Frequency Distribution)
    • 상대빈포로 작성한 빈도분표

  • 누가빈도분포(Cumulative Frequency Distribution)
    • 그 급간에 포함된 빈도와 그 아래쪽의 모든 점수치들의 빈도를 합친 것. 
    • 누가상대빈도분포(cumulative relative frequency distribution): it represents the % of scores accumulated as you move up the scale

GRAPH FORM

  • 빈도다각형/도수다각형(Frequency Polygon)
    • 자료를 일정 크기의 급간으로 묶었을 때, 각 급간 중간점에서 해당 도수를 표시한 후 그 점들을 직선으로 연결한 도표 혹은 그래프. 곡선의 높이가 점수의 빈도를 가리키는 빈도분포이다. 
  • 막대그래프 (Bar Graph)
    • 막대그래프는 범주별 빈도 자료를 범주별로 빈도에 비례하는 길이의 막대로 나타낸 그래프
    • for discrete interval/ratio data, or data measured on a nominal/ordinal scale.
    • Like histogram, but there are spaces between bars to emphasize separate distinct categories
  • 히스토그램 (Histogram) 
    • 도수분포표의 각 계급의 양 끝 값을 가로축에 표시하고 그 계급의 도수를 세로축에 표시하여 직사각형 모양으로 나타낸 그래프
    • 막대그래프와 유사하게 생겼지만 히스토그램은 단지 하나의 변인만을 묘사하며 막대들은 빈틈없이 붙어 있다. 
  • 파이형도표/원형도표(Pie Chart)
    • 전체 자료가 여러개의 카테고리로 분류되어지는 경우, 전체 통계량에 대한 부분의 비율을 하나의 원의 내부에 부채꼴로 구분한 그래프 

 

 

출처: Youtube > Academic Lesson, 네이버 지식백과, 구글

728x90
반응형