#모듈 및 데이터 준비,전처리
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import SGDClassifier
cancer = load_breast_cancer()
x = cancer.data
y = cancer.target

x_train_all, x_test, y_train_all, y_test = train_test_split(x,y, stratify=y, test_size = 0.2, random_state=42)
x_train, x_val, y_train, y_val = train_test_split(x_train_all, y_train_all, stratify=y_train_all, test_size=0.2, random_state=42)

#표준화 (스케일 조정하기)
train_mean = np.mean(x_train, axis=0)
train_std = np.std(x_train, axis=0)
x_train_scaled = (x_train-train_mean)/train_std
x_val_scaled = (x_val-train_mean)/train_std

sgd = SGDClassifier(loss='hinge',random_state=42)
sgd.fit(x_train,y_train)
sgd.score(x_val, y_val)

0.9230769230769231

w = [1,2,3,-4,5]  #np.sign()은 각 값들의 부호를 반환한다.
print(np.sign(w))

[ 1  1  1 -1  1]

class SingleLayer():
    def __init__(self, learning_rate=0.1, l1=0, l2=0):
        self.w = None       # 데이터 특성이 많기 때문에 가중치를 미리 초기화하지 않음.
        self.b = None
        self.losses = []     #훈련 세트의 손실 함수 변화치
        self.w_history=[]    # w값의 가중치의 변화를 보기위해 
        self.val_losses = [] #검증 세트의 손실 함수 변화치
        self.lr=learning_rate
        self.l1 = l1         #L1규제와 L2규제의 강도를 조절하는 매개변수를 추가
        self.l2 = l2
        
    def forpass(self, x):
        z = np.sum(x * self.w) + self.b   # 직선의 방정식 즉 hypothesis #np.sum을 사용하면 1차원 넘파이배열에서 배열의 요소끼리 사칙연산을 할 수 있음.
        return z
    
    def backprop(self, x, err):
        w_grad = x * err                   #가중치에 대한 그레이디언트 계산
        b_grad = 1 * err                   #절편에 대한 그레이디언트 계산
        return w_grad, b_grad
    
    def fit(self, x, y, epochs=100, x_val=None, y_val=None):
        self.w = np.ones(x.shape[1])       #가중치를 초기화하는데 x의 shape과 똑같고 1채움 즉 각 행값 
        self.b = 0
        self.w_history.append(self.w.copy())  #가중치를 기록한다.
        np.random.seed(42)                    #무작위로 시드를 지정한다.
        for i in range(epochs):
            loss = 0
            indexes = np.random.permutation(np.arange(len(x))) #인덱스를 섞음. 데이터가 섞여서 훈련될수록 손실 함수의 값이 효율적으로 줄어듬
            for i in indexes:
                z = self.forpass(x[i])                     #정방향 계산
                a = self.activation(z)                     #activation함수 적용
                err = -(y[i] - a)                          #실제값과 예측값 오차계산
                w_grad, b_grad = self.backprop(x[i], err)  #역방향 계산
                w_grad += self.l1*np.sign(self.w) + self.l2* self.w  #그레이디언트에 패널티 항의 미분값을 더함, 동시에 진행.
                self.w -= w_grad * self.lr                   #업데이트(학습률 적용)
                self.b -= b_grad
                self.w_history.append(self.w.copy())       #가중치를 기록
                a = np.clip(a, 1e-10, 1-1e-10)             #인잔힌 로그 계산을 위해 클리핑 한 후 손실을 누적
            
                
                loss += -(y[i] * np.log(a) + (1-y[i]) * np.log(1-a))  #에포크마다 평균 손실을 저장
            self.losses.append(loss/len(y)+ self.reg_loss())
            self.update_val_loss(x_val,y_val)
            
    def reg_loss(self):
        return self.l1 * np.sum(np.abs(self.w)) + self.l2 / 2 * np.sum(self.w**2)
        
    
    def update_val_loss(self, x_val, y_val):
        if x_val is None :
            return
        val_loss = 0
        for i in range(len(x_val)):
            z = self.forpass(x_val[i])
            a = self.activation(z)
            a = np.clip(a, 1e-10, 1-1e-10)
            val_loss += -(y_val[i]*np.log(a)+ (1-y_val[i])*np.log(1-a))
        self.val_losses.append(val_loss/len(y_val) + self.reg_loss())
                
    def activation(self, z):
        a = 1 / (1 + np.exp(-z))
        return a
    
    def predict(self, x):
        z = [self.forpass(x_i) for x_i in x]              #hypothesis를 구해 반환
        return np.array(z) > 0                            #스텝 함수 적용
    
    def score(self, x, y):
        return np.mean(self.predict(x)==y)

l1_list = [0.0001, 0.001, 0.01]   #l1으로 규제 후 규제강도 별로 loss와 val_loss를 구함

for l1 in l1_list:
    lyr = SingleLayer(l1 = l1)
    lyr.fit(x_train_scaled,y_train, x_val = x_val_scaled, y_val =y_val)
    
    plt.plot(lyr.losses)
    plt.plot(lyr.val_losses)
    plt.title('Learning Curve (l1={})'.format(l1))
    plt.ylabel('loss')
    plt.xlabel('epoch')
    plt.legend(['train_loss','val_loss'])
    plt.ylim(0,0.3)
    plt.show()
    
    plt.plot(lyr.w, 'bo')
    plt.title('Weigth (l1={})'.format(l1))
    plt.ylabel("value")
    plt.xlabel("weight")
    plt.ylim(-4,4)
    plt.show()

layer = SingleLayer(l1=0.001)          #0.01은 과소적합 현상이 생기므로 적당한 규제의 강도는 0.001이고 반복은 20의 에포크 회수를 준다.
layer.fit(x_train_scaled,y_train, epochs=20)
layer.score(x_val_scaled,y_val)

0.978021978021978

l2_list = [0.0001, 0.001, 0.01]

for l2 in l2_list:
    lyr = SingleLayer(l2=l2)
    lyr.fit(x_train_scaled, y_train, x_val = x_val_scaled, y_val= y_val)
    
    plt.plot(lyr.losses)
    plt.plot(lyr.val_losses)
    plt.title('Learning Curve (l2={})'.format(l2))
    plt.ylabel('loss')
    plt.xlabel('epoch')
    plt.legend(['train_loss','val_loss'])
    plt.ylim(0,0.3)
    plt.show()
    
    plt.plot(lyr.w, 'bo')
    plt.title('Weigth (l2={})'.format(l2))
    plt.ylabel("value")
    plt.xlabel("weight")
    plt.ylim(-4,4)
    plt.show()

layer2 = SingleLayer(l2=0.01)      #적당한 L2규제의 강도는 0.01이다.
layer2.fit(x_train_scaled, y_train)
layer2.score(x_val_scaled,y_val)

0.978021978021978

sgd = SGDClassifier(loss='log',penalty='l2',alpha=0.001, random_state=42)  #SGD에서도 바로 사용가능
sgd.fit(x_train_scaled, y_train)
sgd.score(x_val_scaled,y_val)

0.978021978021978

[딥러닝 기초] 다층 신경망 (MLPClassifier) (0)	2020.05.08
[딥러닝 기초] k-fold 교차 검증(cross validation) (0)	2020.05.02
[딥러닝 기초] Neural Network (훈련 노하우) (0)	2020.04.24
[딥러닝 기초] Neural Network (use cancer dataset/classfication) (0)	2020.04.19
[jupyter notebook] Neural Network (use mnist dataset) (0)	2020.04.18

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

EI_HJ

[딥러닝 기초] Neural Network (L1, L2 규제)

L1 규제

L2규제

'빅데이터 | 머신러닝 | 딥러닝 > 딥러닝' 카테고리의 다른 글

'빅데이터 | 머신러닝 | 딥러닝/딥러닝'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

[딥러닝 기초] Neural Network (L1, L2 규제)

L1 규제

L2규제

'빅데이터 | 머신러닝 | 딥러닝 > 딥러닝' 카테고리의 다른 글

'빅데이터 | 머신러닝 | 딥러닝/딥러닝'의 다른글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역