2023. 7. 27. 10:46ㆍIT
머신러닝에서는 사이킷런
딥러닝 텐서플로우
>피처(Feature) 속성?
피처는 데이터 세트의 일반 속성임
머신러닝은 2차원 이상의 다차원 데이터에서도 많이 사용되므로 타겟값을 제외한 나머지 속성을 모두 피처로 지칭
>레이블 ,클래블, 타켓(값), 결정(값),
타겟값 또는 결정값은 지도 학습 시 데이터의 학습을 위해 주어지는 정답 데이터
지도 학습중 분류의 경유에는 이 결정값을 레이블 또는 클래스로 지칭
지도학습 분류
대표적인 지도학습 방법의 하나
지도학습은 학습의 위한 다양한 피처와 븐류 결정값인 레이블 데이터로 모델을 학습한 뒤 별도의 테그스 세트에서 미지의 레이블을 예측
즉 지도학습은 명확란 정답이 주어진 데이터를 먼저 학습한 뒤 미지ㅈ의 정답응 예측하는 방식
이때 학습을 위해 주어진 데이터 세트를 하습데이터 세트.머신러닝 모데을의 예측 성늘을 평가하기 위해 별도로 주어진 뎅터 세트를 테스트 데이트 세트
붓꽃 데이터 분류 예측 프로세스 ( import skleam, laod(data) reavl
테이터세트 분리 > 데이터를 학습 데이터와 테스트 데이터로 분리 - traintest-split()
모델 학습 > 학습 데이터를 기반으로 알고리즘을 적용해 모델을 학습 - 모델선택(객체생성), 모델을 가지고 학습(객체에 따라 시행 : fit() )
예측 수행 > 핟습된 모델을 이용해 데타스 데이터로 븐류 예측 - predict(data)
평가> 예측되 결과값과 테스트 데이터의 실제결과값을 비교해 성능을 평가 -accuracy score
사이킷런 기반 프레임 워크
학습 fit()
예측 predict() 분류 classifier 회귀 regressor
사이킷런의 주요 모듈
예제 데이터
피처 처리
피처처리 차원축소
분리 검증 파리미터 튜닝
평가 - sklearn.metrics 분류,회귀,쿨러스터링,페어와지
ML알고리즘
유틸리티
'IT' 카테고리의 다른 글
2024 비트코인 전망과 반감기 (0) | 2023.12.06 |
---|---|
기초 통계 이론 - 통계학 (0) | 2023.09.17 |
SanDisk Portable SSD 1TB 사용기.. 이.. (0) | 2023.06.21 |
numpyProject 색인 / 값 변경 (0) | 2023.06.12 |
numpyProject 타입변경 / 백터연산 (0) | 2023.06.12 |