import tensorflow as tf
import numpy as np
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.datasets import mnist
from time import time
import os

print(tf.__version__)

2.0.0-beta1

def load(model, checkpoint_dir):
    print("[*] Reading checkpoints..")
    
    ckpt = tf.train.get_checkpoint_state(checkpoint_dir)
    if ckpt :
        ckpt_name = os.path.basename(ckpt.model_checkpoint_path)
        checkpoint = tf.train.Checkpoint(dnn=model)
        checkpoint.restore(save_path= os.path.join(checkpoint_dir, ckpt_name))
        counter = int(ckpt_name.split('-')[1])
        print("[*] Success to read {}".format(ckpt_name))
        return True, counter
    else:
        print("[*] Failed to find a checkpoint")
        return False, 0
    
def check_folder(dir):
    if not os.path.exists(dir):
        os.makedirs(dir)
    return dir

#Data load & pre-processing function

def load_mnist():
    (train_data, train_labels), (test_data, test_labels) = mnist.load_data()
    train_data = np.expand_dims(train_data, axis= -1) #[N, 28, 28] -> [N,28,28,1]
    test_data = np.expand_dims(test_data, axis= -1) # [N, 28, 28] -> [N,28,28, 1]
    
    train_data, test_data = normalize(train_data, test_data)
    
    train_labels = to_categorical(train_labels, 10) #[N,] -> [N, 10] 
    test_labels = to_categorical(test_labels, 10) 
    
    return train_data, train_labels, test_data, test_labels

def normalize(train_data, test_data):
    train_data = train_data.astype(np.float32) / 255.0
    test_data = test_data.astype(np.float32) / 255.0
    return train_data, test_data

#Performance function
def loss_fn(model, images, labels):
    logits = model(images, training=True)
    loss = tf.reduce_mean(tf.keras.losses.categorical_crossentropy(y_pred=logits, y_true=labels,
                                                                  from_logits=True))
    return loss

def accuracy_fn(model, images, labels):
    logits = model(images, training=False)
    prediction = tf.equal(tf.argmax(logits, -1), tf.argmax(labels, -1))
    accuracy = tf.reduce_mean(tf.cast(prediction, tf.float32))
    return accuracy

def grad(model, images, labels):
    with tf.GradientTape() as tape:
        loss = loss_fn(model,images, labels)
    return tape.gradient(loss, model.variables)

#model function
def flatten():
    return tf.keras.layers.Flatten()

def dense(label_dim, weight_init):
    return tf.keras.layers.Dense(units=label_dim, use_bias=True, kernel_initializer=weight_init)

def sigmoid():
    return tf.keras.layers.Activation(tf.keras.activations.sigmoid)

#create model(class version)

class create_model_class(tf.keras.Model):
    def __init__(self, label_dim):
        super(create_model_class,self).__init__()
        weight_init = tf.keras.initializers.RandomNormal
        
        self.model = tf.keras.Sequential()
        self.model.add(flatten())
        
        for i in range(2):
            self.model.add(dense(256, weight_init))
            self.model.add(sigmoid)
        
        self.model.add(dense(label_dim, weight_init))
        
    def call(self, x, training=None, mask=None):
        x = self.model(x)
        
        return x

# create model

def create_model_function(label_dim):
    weight_init = tf.keras.initializers.RandomNormal()
    
    model = tf.keras.Sequential()
    model.add(flatten())
    
    for i in range(2):
        model.add(dense(256, weight_init))
        model.add(sigmoid())
    
    model.add(dense(label_dim, weight_init))
    
    return model

#define data & hyper-parameter

"""dataset"""
train_x, train_y ,test_x, test_y = load_mnist()

"""parameters"""

learning_rate = 0.001
batch_size = 128

training_epochs = 1
training_iterations = len(train_x)  #bacth_Size

label_dim = 10

train_flag = True

"""Graph input using Dataset API"""
train_dataset = tf.data.Dataset.from_tensor_slices((train_x,train_y)).\
    shuffle(buffer_size=100000).\
    prefetch(buffer_size=batch_size).\
    batch(batch_size, drop_remainder=True)

test_dataset = tf.data.Dataset.from_tensor_slices((test_x,test_y)).\
    shuffle(buffer_size=100000).\
    prefetch(buffer_size=len(test_x)).\
    batch(len(test_x))

#Define model & optimizer & writer

"""Model"""
network = create_model_function(label_dim)

"""Training"""
optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)

"""writer"""
checkpoint_dir = 'checkpoint'
logs_dir = 'logs'

model_dir = 'nn_softmax'

checkpoint_dir = os.path.join(checkpoint_dir, model_dir)
check_folder(checkpoint_dir)
checkpoint_prefix = os.path.join(checkpoint_dir, model_dir)
logs_dir = os.path.join(logs_dir, model_dir)

if train_flag :

    checkpoint = tf.train.Checkpoint(dnn=network)

    # create writer for tensorboard
    summary_writer = tf.summary.create_file_writer(logdir=logs_dir)
    start_time = time()

    # restore check-point if it exits
    could_load, checkpoint_counter = load(network, checkpoint_dir)    

    if could_load:
        start_epoch = (int)(checkpoint_counter / training_iterations)        
        counter = checkpoint_counter        
        print(" [*] Load SUCCESS")
    else:
        start_epoch = 0
        start_iteration = 0
        counter = 0
        print(" [!] Load failed...")
    
    # train phase
    with summary_writer.as_default():  # for tensorboard
        for epoch in range(start_epoch, training_epochs):
            for idx, (train_input, train_label) in enumerate(train_dataset):            
                grads = grad(network, train_input, train_label)
                optimizer.apply_gradients(grads_and_vars=zip(grads, network.variables))

                train_loss = loss_fn(network, train_input, train_label)
                train_accuracy = accuracy_fn(network, train_input, train_label)
                
                for test_input, test_label in test_dataset:                
                    test_accuracy = accuracy_fn(network, test_input, test_label)

                tf.summary.scalar(name='train_loss', data=train_loss, step=counter)
                tf.summary.scalar(name='train_accuracy', data=train_accuracy, step=counter)
                tf.summary.scalar(name='test_accuracy', data=test_accuracy, step=counter)

                print(
                    "Epoch: [%2d] [%5d/%5d] time: %4.4f, train_loss: %.8f, train_accuracy: %.4f, test_Accuracy: %.4f" \
                    % (epoch, idx, training_iterations, time() - start_time, train_loss, train_accuracy,
                       test_accuracy))
                counter += 1                
        checkpoint.save(file_prefix=checkpoint_prefix + '-{}'.format(counter))
        
# test phase      
else :
    _, _ = load(network, checkpoint_dir)
    for test_input, test_label in test_dataset:    
        test_accuracy = accuracy_fn(network, test_input, test_label)

    print("test_Accuracy: %.4f" % (test_accuracy))

[*] Reading checkpoints..
[*] Failed to find a checkpoint
 [!] Load failed...
Epoch: [ 0] [    0/60000] time: 0.8268, train_loss: 2.36806631, train_accuracy: 0.1250, test_Accuracy: 0.1096
Epoch: [ 0] [    1/60000] time: 0.9245, train_loss: 2.28677988, train_accuracy: 0.1328, test_Accuracy: 0.1010
Epoch: [ 0] [    2/60000] time: 1.0192, train_loss: 2.25089169, train_accuracy: 0.1562, test_Accuracy: 0.1136
Epoch: [ 0] [    3/60000] time: 1.1230, train_loss: 2.29961181, train_accuracy: 0.0547, test_Accuracy: 0.1135
Epoch: [ 0] [    4/60000] time: 1.2247, train_loss: 2.26263475, train_accuracy: 0.2578, test_Accuracy: 0.1896
Epoch: [ 0] [    5/60000] time: 1.3573, train_loss: 2.25411654, train_accuracy: 0.1719, test_Accuracy: 0.1032
Epoch: [ 0] [    6/60000] time: 1.4590, train_loss: 2.26882124, train_accuracy: 0.0938, test_Accuracy: 0.1032
Epoch: [ 0] [    7/60000] time: 1.5598, train_loss: 2.25703335, train_accuracy: 0.1250, test_Accuracy: 0.1080
Epoch: [ 0] [    8/60000] time: 1.6605, train_loss: 2.28595734, train_accuracy: 0.1562, test_Accuracy: 0.1756
Epoch: [ 0] [    9/60000] time: 1.7582, train_loss: 2.25078464, train_accuracy: 0.2266, test_Accuracy: 0.2537
Epoch: [ 0] [   10/60000] time: 1.8700, train_loss: 2.20269799, train_accuracy: 0.1328, test_Accuracy: 0.1370
Epoch: [ 0] [   11/60000] time: 1.9817, train_loss: 2.20254898, train_accuracy: 0.0938, test_Accuracy: 0.1016
Epoch: [ 0] [   12/60000] time: 2.0784, train_loss: 2.19096851, train_accuracy: 0.1484, test_Accuracy: 0.1648
Epoch: [ 0] [   13/60000] time: 2.1742, train_loss: 2.19529772, train_accuracy: 0.2422, test_Accuracy: 0.2954
Epoch: [ 0] [   14/60000] time: 2.2799, train_loss: 2.17700243, train_accuracy: 0.3594, test_Accuracy: 0.3847
Epoch: [ 0] [   15/60000] time: 2.3975, train_loss: 2.16270113, train_accuracy: 0.3906, test_Accuracy: 0.4139
Epoch: [ 0] [   16/60000] time: 2.4953, train_loss: 2.17175102, train_accuracy: 0.3125, test_Accuracy: 0.3793
Epoch: [ 0] [   17/60000] time: 2.5940, train_loss: 2.11604834, train_accuracy: 0.3672, test_Accuracy: 0.3444
Epoch: [ 0] [   18/60000] time: 2.7027, train_loss: 2.14183974, train_accuracy: 0.3047, test_Accuracy: 0.3715
Epoch: [ 0] [   19/60000] time: 2.8044, train_loss: 2.10157919, train_accuracy: 0.3906, test_Accuracy: 0.4031
Epoch: [ 0] [   20/60000] time: 2.9161, train_loss: 2.08549476, train_accuracy: 0.4766, test_Accuracy: 0.4693
Epoch: [ 0] [   21/60000] time: 3.0189, train_loss: 2.05075026, train_accuracy: 0.5156, test_Accuracy: 0.5158
Epoch: [ 0] [   22/60000] time: 3.1136, train_loss: 2.09807849, train_accuracy: 0.4453, test_Accuracy: 0.5510
Epoch: [ 0] [   23/60000] time: 3.2223, train_loss: 2.05387449, train_accuracy: 0.5469, test_Accuracy: 0.5968
Epoch: [ 0] [   24/60000] time: 3.3341, train_loss: 2.01676393, train_accuracy: 0.6094, test_Accuracy: 0.5998
Epoch: [ 0] [   25/60000] time: 3.4537, train_loss: 1.97315645, train_accuracy: 0.6328, test_Accuracy: 0.5864
Epoch: [ 0] [   26/60000] time: 3.5544, train_loss: 1.97140563, train_accuracy: 0.6094, test_Accuracy: 0.5702
Epoch: [ 0] [   27/60000] time: 3.6552, train_loss: 1.97519779, train_accuracy: 0.5781, test_Accuracy: 0.5855
Epoch: [ 0] [   28/60000] time: 3.7539, train_loss: 1.93528223, train_accuracy: 0.6016, test_Accuracy: 0.6285
Epoch: [ 0] [   29/60000] time: 3.8596, train_loss: 1.89910841, train_accuracy: 0.6719, test_Accuracy: 0.6472
Epoch: [ 0] [   30/60000] time: 3.9584, train_loss: 1.90951204, train_accuracy: 0.6406, test_Accuracy: 0.6637
Epoch: [ 0] [   31/60000] time: 4.0531, train_loss: 1.91478336, train_accuracy: 0.6250, test_Accuracy: 0.6922
Epoch: [ 0] [   32/60000] time: 4.1538, train_loss: 1.84158063, train_accuracy: 0.6328, test_Accuracy: 0.7132
Epoch: [ 0] [   33/60000] time: 4.2536, train_loss: 1.83942056, train_accuracy: 0.7344, test_Accuracy: 0.7183
Epoch: [ 0] [   34/60000] time: 4.3513, train_loss: 1.79055476, train_accuracy: 0.6641, test_Accuracy: 0.6973
Epoch: [ 0] [   35/60000] time: 4.4501, train_loss: 1.81603146, train_accuracy: 0.6016, test_Accuracy: 0.6982
Epoch: [ 0] [   36/60000] time: 4.5558, train_loss: 1.71743405, train_accuracy: 0.7578, test_Accuracy: 0.6941
Epoch: [ 0] [   37/60000] time: 4.6585, train_loss: 1.72784555, train_accuracy: 0.6953, test_Accuracy: 0.6924
Epoch: [ 0] [   38/60000] time: 4.7582, train_loss: 1.69969416, train_accuracy: 0.6797, test_Accuracy: 0.6810
Epoch: [ 0] [   39/60000] time: 4.8609, train_loss: 1.65071285, train_accuracy: 0.6875, test_Accuracy: 0.6756
Epoch: [ 0] [  457/60000] time: 47.7068, train_loss: 0.20553184, train_accuracy: 0.9453, test_Accuracy: 0.9276
Epoch: [ 0] [  458/60000] time: 47.8105, train_loss: 0.22368088, train_accuracy: 0.9375, test_Accuracy: 0.9281
Epoch: [ 0] [  459/60000] time: 47.9072, train_loss: 0.22513360, train_accuracy: 0.9141, test_Accuracy: 0.9280
Epoch: [ 0] [  460/60000] time: 48.0030, train_loss: 0.19532414, train_accuracy: 0.9609, test_Accuracy: 0.9279
Epoch: [ 0] [  461/60000] time: 48.1097, train_loss: 0.26649928, train_accuracy: 0.9141, test_Accuracy: 0.9276
Epoch: [ 0] [  462/60000] time: 48.2124, train_loss: 0.17376046, train_accuracy: 0.9531, test_Accuracy: 0.9276
Epoch: [ 0] [  463/60000] time: 48.3081, train_loss: 0.28178105, train_accuracy: 0.9141, test_Accuracy: 0.9285
Epoch: [ 0] [  464/60000] time: 48.4119, train_loss: 0.16605219, train_accuracy: 0.9766, test_Accuracy: 0.9286
Epoch: [ 0] [  465/60000] time: 48.5136, train_loss: 0.39161086, train_accuracy: 0.8828, test_Accuracy: 0.9283
Epoch: [ 0] [  466/60000] time: 48.6153, train_loss: 0.34757400, train_accuracy: 0.8906, test_Accuracy: 0.9289
Epoch: [ 0] [  467/60000] time: 48.7150, train_loss: 0.16808197, train_accuracy: 0.9297, test_Accuracy: 0.9287

[딥러닝 기초] 다층 신경망 (MLPClassifier) (0)	2020.05.08
[딥러닝 기초] k-fold 교차 검증(cross validation) (0)	2020.05.02
[딥러닝 기초] Neural Network (L1, L2 규제) (0)	2020.04.25
[딥러닝 기초] Neural Network (훈련 노하우) (0)	2020.04.24
[딥러닝 기초] Neural Network (use cancer dataset/classfication) (0)	2020.04.19

EI_HJ

[jupyter notebook] Neural Network (use mnist dataset)

'빅데이터 | 머신러닝 | 딥러닝 > 딥러닝' 카테고리의 다른 글

'빅데이터 | 머신러닝 | 딥러닝/딥러닝'의 다른글

티스토리툴바

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

[jupyter notebook] Neural Network (use mnist dataset)

'빅데이터 | 머신러닝 | 딥러닝 > 딥러닝' 카테고리의 다른 글

'빅데이터 | 머신러닝 | 딥러닝/딥러닝'의 다른글

관련글

티스토리툴바