2023. 9. 17. 05:52ㆍIT
- 통계 statistic
수치적인 사실
분석의 대상이 되는 지반에 대하여 실시한 조사나 실험의 결과로 얻은 결과치 또는 그 결과치들의 요약된 형태
- -통계학 statistics
효과적인 의사결정을 도와준는 데이터 수집
과학적인 추론을 통해 합리적인 의사결정을 도출하는 학문
- -기술통계학 descriptive statistics
데이터를 유용한 정보ㄴ를 주는 방식으로 체계화하고 요약, 표현하는 방법
- -추론 통계학 inferential statistics
표본에 기반하여 모집단의 특성을 추정하기 위한 방법
한정된 크기의 데이터를 사용하여 의사결정을 함
- 통계적 추론이란
모집단에서 연구의 대상으로 채택된 일부모집단에서 연구의 대상으로 채택된 일부
- 모집단과 모수
모집단(population) 통계분석의 대상이 되는 모든 개체들의 집합
모수(parameter) 모집단의 특성을 나타내는 수치로 모평균, 모분산, 모비율
- 표본과 표본 통계량
표본(samlpe) 모집단으로부터 임의로 추출된 모집단의 부분집합
표본통계량(smaple statistic) 표본의 특성을 나타내는 척도로 표본 평균, 표본분선, 표본비율이 쓰임
- 변수의 종류
정성적(qualitative)변수 -비수치적인 특성치 또는 속성으로서 관찰 또는 기록된 변수( 남녀, 선호도)
정량적(quantitative)변수-수치적으로 기록된 변수 (통장잔고, 수명, 인원)
-이산형변수(discreate variable)
수의 결과, 두 값의 차이
-연속형변수(cpntinuous variable)
측정의 결과, 특정한 범위 내의 어떤 값
- 측정의 척도(levels of measurement)
1. 명목척도 - 카테고리로 분류되지만 순서대로 정렬될 수는 없음
2. 순서척도 - 순서대로 정렬할 수 있지만 데이터 값 간의 차이와 의미를 확인할 수 없다
3. 등간척도 - 순서대로 정렬할 수 있다. 데이터 값 간의 차이를 계산할 수 있으며 그 차이가 의미가 있다. 하지만 0점이 없다.
4. 비율척도 - 순서대로 정렬할 수 있다. 데이터 값 간의 차이를 계산할 수 있으며 그 차이가 의미가 있다. 절대적인 0점이 존재하며
의미가 있다. 비율을 측정하는 것이 가능하며 의미가 있다
- 명목척도는 가장 하위의 측정척도이다. = ,≠
- 명목척도로 기록된 데이터는 레이블이나 명칭으로 대표된다
- 특정한 순서는 없다
- 분류할 수 있으며, 빈도수를 셀 수 있다. 농심 과자의 분류, 특정 과자를 좋아하는 사람의 수 - 다음 단계의 측청척도는 순서척도. =, ≠, ≤ ,≥
- 정의된 속성 정성변수에 대한 상대적인 순위 또는 등급에 기반. 순서척도에 기반한 변수는 오로지 순위로 매겨지거나 빈도측정
- 1등과 2등의 차이는 알 수가 없다 - 다음 단계의 측정척도는 등간척도. =, ≠, ≤ ,≥, + , -
- 서열척도의 모든 특징을 포함하면서 값들 사이의 간격 또는 차이가 의미가 있다
- 알려진 측정단위의 척도를 기반으로 한다.
- 절대 적인 0 이란 값이 존재하지 않는다. 온도 : 0도, 10도, 20도 - 가장 상위의 측정척도는 비율척도. =, ≠, ≤ ,≥, + , -, ÷, ×
- 등간척도의 모든 특성을 포함하면서 두 숫자 사이의 비율이 의미가 없다
- 0 이란 값은 특성치의 값이 없음을 의미한다
- 임금, 주식의 변화, 무게

데이터 사이언티스트
'IT' 카테고리의 다른 글
| ZEPETO 제페토 슬라임 초대코드 공유해요 (1) | 2024.03.30 |
|---|---|
| 2024 비트코인 전망과 반감기 (0) | 2023.12.06 |
| 머신러닝을 위한 용어 정리 (0) | 2023.07.27 |
| SanDisk Portable SSD 1TB 사용기.. 이.. (0) | 2023.06.21 |
| numpyProject 색인 / 값 변경 (0) | 2023.06.12 |