머신러닝을 위한 용어 정리

2023. 7. 27. 10:46IT

반응형

머신러닝에서는 사이킷런 

딥러닝 텐서플로우

 

>피처(Feature) 속성?

피처는 데이터 세트의 일반 속성임

머신러닝은 2차원 이상의 다차원 데이터에서도 많이 사용되므로 타겟값을 제외한 나머지 속성을 모두 피처로 지칭

 

>레이블 ,클래블, 타켓(값), 결정(값),

타겟값 또는 결정값은 지도 학습 시 데이터의 학습을 위해 주어지는 정답 데이터

지도 학습중 분류의 경유에는 이 결정값을 레이블 또는 클래스로 지칭

 

 

지도학습 분류

 

대표적인 지도학습 방법의 하나

지도학습은 학습의 위한 다양한 피처와 븐류 결정값인 레이블 데이터로 모델을 학습한 뒤 별도의 테그스 세트에서 미지의 레이블을 예측

즉 지도학습은 명확란 정답이 주어진 데이터를 먼저 학습한 뒤 미지ㅈ의 정답응 예측하는 방식

이때 학습을 위해 주어진 데이터 세트를 하습데이터 세트.머신러닝 모데을의 예측 성늘을 평가하기 위해 별도로 주어진 뎅터 세트를 테스트 데이트 세트

 

붓꽃 데이터 분류 예측 프로세스 ( import skleam, laod(data) reavl

테이터세트 분리 > 데이터를 학습 데이터와 테스트 데이터로 분리 - traintest-split()

모델 학습 > 학습 데이터를 기반으로 알고리즘을 적용해 모델을 학습 - 모델선택(객체생성), 모델을 가지고 학습(객체에 따라 시행 : fit() )

예측 수행 > 핟습된 모델을 이용해 데타스 데이터로 븐류 예측 - predict(data)

평가>  예측되 결과값과 테스트 데이터의 실제결과값을 비교해 성능을 평가 -accuracy score

사이킷런 기반 프레임 워크

학습 fit()

예측 predict()           분류  classifier                     회귀 regressor

 

사이킷런의 주요 모듈

예제 데이터

피처 처리

피처처리 차원축소

분리 검증 파리미터 튜닝

평가                               - sklearn.metrics          분류,회귀,쿨러스터링,페어와지

ML알고리즘

유틸리티

 

반응형

'IT' 카테고리의 다른 글

2024 비트코인 전망과 반감기  (0) 2023.12.06
기초 통계 이론 - 통계학  (0) 2023.09.17
SanDisk Portable SSD 1TB 사용기.. 이..  (0) 2023.06.21
numpyProject 색인 / 값 변경  (0) 2023.06.12
numpyProject 타입변경 / 백터연산  (0) 2023.06.12