반응형

딥러닝 기초 3

[딥러닝 기초] Neural Network (L1, L2 규제)

[이 글은 "Do it 딥러닝 입문" 책을 보고 공부한 내용을 복습하고자 정리한 글입니다.] 목표 - 과대적합, 과소적합을 이해하고 L1규제와 L2규제에 대해 이해한다. [배운 점] 과대적합 - 모델이 훈련 세트에서는 좋은 성능을 내지만 검증 세트에서는 낮은 성능을 내는 경우. - 정확도/Epochs 그래프를 그려보면 측정한 성능의 간격이 크다. 이를 '분산이 크다'라고도 말한다. - 훈련세트의 다양성이 없어서 나오는 경우, 훈련 세트를 더 모으지 못한다면, 모델이 훈련세트에 집착하지 않도록 가중치 제한을 둘 수 있다. 이를 '모델의 복잡도를 낮춘다'라고 말한다. 과소적합 - 모델이 훈련세트와 검증세트에서 많은 성능차이를 보이진 않지만 둘 다 성능이 저조한 경우. - 정확도/Epochs 그래프에서 성능 ..

[딥러닝 기초] Neural Network (훈련 노하우)

[이 글은 "Do it 딥러닝 입문" 책을 보고 공부한 내용을 복습하고자 정리한 글입니다.] 목표 - 주어진 데이터 셋으로 어떻게 훈련했을 때 가장 효율이 좋은지 알아본다. [배운 점] 모듈 - sklean.linear_model 모듈을 통해 모델을 임포트 할 수 있다. (ex. SGDClassifier) - model의 하이퍼파라미터로 loss함수를 지정해줄 수 있다. (ex. hinge, log) 훈련데이터 세트 - 테스트 세트로 모델을 튜닝하면 테스트 세트에 대해서만 좋은 성능을 낼 수 있으므로 실전에서 좋은 성능을 기대하기 어렵다.(실전 투입 마지막 한 번만 사용하는 게 좋다.) - 훈련세트를 훈련세트와 검증세트로 나눠서 활용한다. (비율은 80 20 20) 스케일(Scale) - 우리는 잘 가공..

[딥러닝 기초] Neural Network (use cancer dataset/classfication)

[이 글은 "Do it 딥러닝 입문" 책을 보고 공부한 내용을 복습하고자 정리한 글입니다.] 목표 - 유방암 데이터 셋으로부터 모델을 만들고 테스트 후 정확도를 확인한다. sklearn(Scikit-learn이란? - 파이썬에 있는 머신러닝 라이브러리 중 하나로, 분류(classification), 회귀(regression), 군집화(clustering), 의사결정 트리(decision tree) 등의 다양한 알고리즘을 적용할 수 있는 다양한 함수들을 제공하는 라이브러리 [공부 중 궁금했던 것과 사용한 함수들을 정리] 1. from sklearn.dataset import load_breast_cancer - 사이킷런에서 유방암 데이터를 로드 2. plt.boxplot(cancer.data) - canc..

반응형