기초 통계 이론 - 통계학

2023. 9. 17. 05:52IT

반응형
  • 통계 statistic

  수치적인 사실

  분석의 대상이 되는 지반에 대하여 실시한 조사나 실험의 결과로 얻은 결과치 또는 그 결과치들의 요약된 형태

 

  • -통계학 statistics

  효과적인 의사결정을 도와준는 데이터 수집

  과학적인 추론을 통해 합리적인 의사결정을 도출하는 학문

 

  • -기술통계학 descriptive statistics

  데이터를 유용한 정보ㄴ를 주는 방식으로 체계화하고 요약, 표현하는 방법

 

  • -추론 통계학 inferential statistics

  표본에 기반하여 모집단의 특성을 추정하기 위한 방법

  한정된 크기의 데이터를 사용하여 의사결정을 함

       

  •  통계적 추론이란

 모집단에서 연구의 대상으로 채택된 일부모집단에서 연구의 대상으로 채택된 일부

 

  • 모집단과 모수

모집단(population) 통계분석의 대상이 되는 모든 개체들의 집합

모수(parameter) 모집단의 특성을 나타내는 수치로 모평균, 모분산, 모비율

 

  • 표본과 표본 통계량

표본(samlpe) 모집단으로부터 임의로 추출된 모집단의 부분집합

표본통계량(smaple statistic) 표본의 특성을 나타내는 척도로 표본 평균, 표본분선, 표본비율이 쓰임

 

  • 변수의 종류

    정성적(qualitative)변수 -비수치적인 특성치 또는 속성으로서 관찰 또는 기록된 변수( 남녀, 선호도)

        정량적(quantitative)변수-수치적으로 기록된 변수 (통장잔고, 수명, 인원)

          -이산형변수(discreate variable)

               수의 결과, 두 값의 차이

 

          -연속형변수(cpntinuous variable)

             측정의 결과, 특정한 범위 내의 어떤 값

 

  • 측정의 척도(levels of measurement)
    1. 명목척도 - 카테고리로 분류되지만 순서대로 정렬될 수는 없음
    2. 순서척도 - 순서대로 정렬할 수 있지만 데이터 값 간의 차이와 의미를 확인할 수 없다
    3. 등간척도 - 순서대로 정렬할 수 있다. 데이터 값 간의 차이를 계산할 수 있으며 그 차이가 의미가 있다. 하지만 0점이 없다.
    4. 비율척도 - 순서대로 정렬할 수 있다. 데이터 값 간의 차이를 계산할 수 있으며 그 차이가 의미가 있다. 절대적인 0점이 존재하며 
                         의미가 있다. 비율을 측정하는 것이 가능하며 의미가 있다

  

  •      명목척도는 가장 하위의 측정척도이다. = ,≠
    - 명목척도로 기록된 데이터는 레이블이나 명칭으로 대표된다
    - 특정한 순서는 없다
    - 분류할 수 있으며, 빈도수를 셀 수 있다. 농심 과자의 분류, 특정 과자를 좋아하는 사람의 수

  • 다음 단계의 측청척도는 순서척도.  =, ≠, ≤ ,≥
      - 정의된 속성 정성변수에 대한 상대적인 순위 또는 등급에 기반. 순서척도에 기반한 변수는 오로지 순위로 매겨지거나 빈도측정
      - 1등과 2등의 차이는 알 수가 없다

  • 다음 단계의 측정척도는 등간척도. =, ≠, ≤ ,≥, + , -
    - 서열척도의 모든 특징을 포함하면서 값들 사이의 간격 또는 차이가 의미가 있다
    - 알려진 측정단위의 척도를 기반으로 한다.
    - 절대 적인 0 이란 값이 존재하지 않는다. 온도 : 0도, 10도, 20도
  • 가장 상위의 측정척도는 비율척도. =, ≠, ≤ ,≥, + , -, ÷, ×
    - 등간척도의 모든 특성을 포함하면서 두 숫자 사이의 비율이 의미가 없다
    - 0 이란 값은 특성치의 값이 없음을 의미한다
    - 임금, 주식의 변화, 무게

 

 

 

 

 

데이터 사이언티스트

반응형