Untitled

import numpy as np
import tensorflow as tf
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt

SEQ_LENGTH = 10

class testrnn:
    def __init__(self,config):
        self.config = config
        tf.reset_default_graph()
        with tf.variable_scope("rnnlch") as scope:
            self.input_data = tf.placeholder(tf.float32,[None,config.MaxNumSteps])
            self.eval_input_data = tf.placeholder(tf.float32,[1,3])#create eval node, 3 time steps
            self.eval_target = tf.Variable(tf.constant(0.0,shape=[SEQ_LENGTH]))
            self.target = tf.placeholder(tf.float32,[None,config.MaxNumSteps])
            loss = tf.Variable(0.,trainable=False)
            x_split = tf.split(0,config.batch_size,self.input_data)
            y_split = tf.split(0,config.batch_size,self.target)
            x_eval_split = tf.split(0,1,self.eval_input_data)# split the evaluation input by the number of time steps

            w = tf.Variable(tf.random_normal([config.hidden_size,config.FC_Units],stddev=0.1),trainable=True)
            b = tf.Variable(tf.constant(0.0,shape=[config.FC_Units]),trainable=True)
            w_2 = tf.Variable(tf.random_normal([config.FC_Units,config.MaxNumSteps],stddev=0.1),trainable=True)
            b_2 = tf.Variable(tf.constant(0.0,shape=[config.MaxNumSteps]),trainable=True)
            #Initialize basic lstm cell
            lstm = tf.nn.rnn_cell.BasicLSTMCell(config.hidden_size,state_is_tuple=True)
            ops, states = tf.nn.rnn(lstm,x_split,dtype=tf.float32)
            #lstm_multi = tf.nn.rnn_cell.MultiRNNCell([lstm]*config.num_layers,state_is_tuple=True)
            #ops, states = tf.nn.rnn(lstm_multi,x_split,dtype=tf.float32)
            self.output = []
            #Compute loss
            for op,target in zip(ops,y_split):
                transform = tf.nn.elu(tf.matmul(op,w)+b)
                drop_out = tf.nn.dropout(transform,keep_prob=0.6)
                fc_layer2 = tf.nn.elu(tf.matmul(drop_out,w_2)+b_2)
                self.output.append(fc_layer2)
                loss += self.loss_function(transform,target,w,b)

            #Use the variables above to also unravel the eval node
            self.loss = loss
            self.lr = tf.Variable(0.0, trainable=False)
            '''
            tvars = tf.trainable_variables()
            grads, _ = tf.clip_by_global_norm(tf.gradients(loss, tvars),
                                          config.max_grad_norm)
            #optimizer = tf.train.GradientDescentOptimizer(self.lr)
            #optimizer = tf.train.MomentumOptimizer(learning_rate=self.lr,momentum=0.5)
            optimizer = tf.train.AdamOptimizer(learning_rate=self.lr)
            self.train_op = optimizer.apply_gradients(zip(grads, tvars))
            '''
            self.train_op = tf.train.AdamOptimizer(learning_rate=self.lr).minimize(loss)
            #Eval network
            scope.reuse_variables()
            for tstep in range(SEQ_LENGTH):
                if tstep < 3:
                    import IPython; IPython.embed()
                    tmp = lstm(x_eval_split,tf.zeros([1,1]))
                    self.eval_target[tstep] = tmp
                else:
                    self.eval_target[tstep] = lstm(self.eval_target[tstep])


    def loss_function(self,ip,op,w,b):
        return tf.reduce_mean((ip-op)**2) + tf.nn.l2_loss(w) + tf.nn.l2_loss(b)


    def generate_data(self,num=None):
            x_data_list = np.zeros((num,self.config.MaxNumSteps+1))
            y_data_list = np.zeros((num,self.config.MaxNumSteps+1))
            for j in range(0,num):
                    #generate randome sequence equal to number of points
                    x_data = np.array([np.linspace(0,4*np.pi,num = self.config.MaxNumSteps+1)] )
                    #x_data = np.random.rand(BATCH_SIZE,TOTAL_NUM_POINTS)
                    y_data = self.transform(x_data)
                    #y_data = np.reshape(y_data,[BATCH_SIZE,TOTAL_NUM_POINTS])
                    x_data_list[j,:] = x_data
                    y_data_list[j,:] = y_data

            return x_data_list,y_data_list

    def transform(self,x):
        return 0.5*np.sin(x) + np.random.rand()/100.
        #return 0.5*np.sin(x) + 0.25

    def assign_lr(self, session, lr_value):
        session.run(tf.assign(self.lr, lr_value))

    def plot_data(self,data):
        fig = plt.figure()
        for ii in range(data.shape[0]):
            plt.plot(data[ii,:])
            plt.hold(True)
        return fig


def run_model(sess,m,data,eval_op,verbose=True):
  cost,_ = sess.run([m.loss,eval_op],{m.input_data: data[:,:-1],m.target: data[:,1:]})
  return cost


class TestConfig(object):
  """Tiny config, for testing."""
  learning_rate = 1e-3
  max_grad_norm = 0.1
  num_layers = 2
  MaxNumSteps = 20
  feat_dims = 1
  hidden_size = 10
  max_epoch = 1
  lr_decay = 0.
  batch_size = 20
  num_layers = 2
  FC_Units = 20

if __name__ == "__main__":
   config = TestConfig()
   m = testrnn(config)
   cost_lst = []
   with tf.Session() as sess:
        sess.run(tf.initialize_all_variables())
        for ii in range(500):
            m.assign_lr(sess,config.learning_rate)
            ind,data = m.generate_data(m.config.batch_size)
            cost = run_model(sess,m,data,m.train_op)
            cost_lst.append(cost)
            if np.mod(ii,100) == 0:
                print("cost is {}".format(cost))
        plt.plot(cost_lst)
        plt.title('Cost vs iterations')
        plt.savefig('RNN_train_1.png')
        import IPython; IPython.embed()