Added tests (fd84f115) · Commits · 钟慕尧 / deepchem

deepchem/models/rnn.py

0 → 100644

+191 −0

Original line number	Diff line number	Diff line
		import deepchem as dc
		import tensorflow as tf
		import numpy as np
		from deepchem.models import KerasModel
		from deepchem.models.layers import SwitchedDropout
		from deepchem.metrics import to_one_hot
		from tensorflow.keras.layers import Input, Dense, Reshape, Softmax, Dropout, Activation, Lambda
		import tensorflow.keras.layers as layers
		try:
		from collections.abc import Sequence as SequenceCollection
		except:
		from collections import Sequence as SequenceCollection


		class RNN(KerasModel):
		"""A recurrent neural network for either regression or classification.

		Heavily based on deepchem/models/cnn.py and Keras.io RNN documentation (Zhu, Chollet)
		Parts of code are taken from deepchem/models/cnn.py and Keras.io RNN documentation

		The network consists of the following sequence of layers:
		- An embedding layer
		- A configurable number of RNN layers
		- A final dense layer to compute the output
		"""

		def __init__(self,
		n_tasks,
		n_features,
		n_dims,
		layer_input_dims=(256, 128, 64),
		bidirectional=True,
		weight_init_stddevs=0.02,
		bias_init_consts=1.0,
		weight_decay_penalty=0.0,
		weight_decay_penalty_type='l2',
		dropouts=0.5,
		activation_fns=tf.nn.relu,
		dense_layer_size=1000,
		layerType='LSTM',
		mode='classification',
		n_classes=2,
		uncertainty=False,
		padding='valid',
		encoder_vocab = 1000,
		decoder_vocab = 2000,
		**kwargs):
		"""Create a RNN.

		In addition to the following arguments, this class also accepts
		all the keyword arguments from TensorGraph.
		"""

		if dims not in (1, 2, 3):
		raise ValueError("n_dims must be 1, 2, or 3 at this time.")
		if mode not in ['classification', 'regression']:
		raise ValueError("mode must be either 'classification' or 'regression'")
		self.n_tasks = n_tasks
		self.n_features = n_features
		self.dims = n_dims
		self.mode = mode
		self.n_classes = n_classes
		self.uncertainty = uncertainty
		n_layers = len(layer_input_dims)
		if not isinstance(kernel_size, list):
		kernel_size = [kernel_size] * n_layers
		if not isinstance(weight_init_stddevs, SequenceCollection):
		weight_init_stddevs = [weight_init_stddevs] * (n_layers + 1)
		if not isinstance(bias_init_consts, SequenceCollection):
		bias_init_consts = [bias_init_consts] * (n_layers + 1)
		if not isinstance(dropouts, SequenceCollection):
		dropouts = [dropouts] * n_layers
		if not isinstance(activation_fns, SequenceCollection):
		activation_fns = [activation_fns] * n_layers
		if weight_decay_penalty != 0.0:
		if weight_decay_penalty_type == 'l1':
		regularizer = tf.keras.regularizers.l1(weight_decay_penalty)
		else:
		regularizer = tf.keras.regularizers.l2(weight_decay_penalty)
		else:
		regularizer = None
		if uncertainty:
		if mode != "regression":
		raise ValueError("Uncertainty is only supported in regression mode")
		if any(d == 0.0 for d in dropouts):
		raise ValueError(
		'Dropout must be included in every layer to predict uncertainty')

		# Add the input features.

		features = Input(shape=(None,) * dims + (n_features,))
		dropout_switch = Input(shape=tuple())
		next_activation = None

		prev_layer = layers.Embedding(input_dim=encoder_vocab, output_dim=layer_input_dims[0])(
		features
		)

		if layerType == 'LSTM':
		RecurrentLayer = layers.LSTM
		elif layerType == 'GRU':
		RecurrentLayer = layers.GRU
		print("Warning: GRU support is experimental at this time.")
		elif layerType == 'SimpleRNN':
		RecurrentLayer = layers.SimpleRNN
		print("Warning: SimpleRNN support is experimental at this time.")
		else:
		raise ValueError('layerType must be "LSTM," "GRU," or "SimpleRNN."')

		if bidirectional == True:
		RecurrentLayer = layers.Bidirectional(RecurrentLayer)

		for dim, size, weight_stddev, bias_const, dropout, activation_fn in zip(
		layer_input_dims, kernel_size, weight_init_stddevs, bias_init_consts,
		dropouts, activation_fns):
		layer = prev_layer
		if next_activation is not None:
		layer = Activation(next_activation)(layer)
		output, state_h, state_c = recurrentLayer(
		dim,
		return_state=True,
		return_sequences=True,
		use_bias=(bias_init_consts is not None),
		kernel_initializer=tf.keras.initializers.TruncatedNormal(
		stddev=weight_stddev),
		bias_initializer=tf.constant_initializer(
		value=bias_const),
		kernel_regularizer=regularizer)(layer)
		)
		state = [state_h, state_c]
		if dropout > 0.0:
		layer = SwitchedDropout(rate=dropout)([layer, dropout_switch])
		prev_layer = layer
		next_activation = activation_fn

		if next_activation is not None:
		prev_layer = Activation(activation_fn)(prev_layer)
		if mode == 'classification':
		logits = Reshape((n_tasks,
		n_classes))(Dense(n_tasks * n_classes)(prev_layer))
		output = Softmax()(logits)
		outputs = [output, logits]
		output_types = ['prediction', 'loss']
		loss = dc.models.losses.SoftmaxCrossEntropy()
		else:
		output = Reshape((n_tasks,))(Dense(
		n_tasks,
		kernel_initializer=tf.keras.initializers.TruncatedNormal(
		stddev=weight_init_stddevs[-1]),
		bias_initializer=tf.constant_initializer(
		value=bias_init_consts[-1]))(prev_layer))
		if uncertainty:
		log_var = Reshape((n_tasks, 1))(Dense(
		n_tasks,
		kernel_initializer=tf.keras.initializers.TruncatedNormal(
		stddev=weight_init_stddevs[-1]),
		bias_initializer=tf.constant_initializer(value=0.0))(prev_layer))
		var = Activation(tf.exp)(log_var)
		outputs = [output, var, output, log_var]
		output_types = ['prediction', 'variance', 'loss', 'loss']

		def loss(outputs, labels, weights):
		diff = labels[0] - outputs[0]
		return tf.reduce_mean(diff * diff / tf.exp(outputs[1]) + outputs[1])
		else:
		outputs = [output]
		output_types = ['prediction']
		loss = dc.models.losses.L2Loss()
		model = tf.keras.Model(inputs=[features, dropout_switch], outputs=outputs)
		super(RNN, self).__init__(model, loss, output_types=output_types, **kwargs)

		def default_generator(self,
		dataset,
		epochs=1,
		mode='fit',
		deterministic=True,
		pad_batches=True):
		for epoch in range(epochs):
		for (X_b, y_b, w_b, ids_b) in dataset.iterbatches(
		batch_size=self.batch_size,
		deterministic=deterministic,
		pad_batches=pad_batches):
		if self.mode == 'classification':
		if y_b is not None:
		y_b = to_one_hot(y_b.flatten(), self.n_classes).reshape(
		-1, self.n_tasks, self.n_classes)
		if mode == 'predict':
		dropout = np.array(0.0)
		else:
		dropout = np.array(1.0)
		yield ([X_b, dropout], [y_b], [w_b])

deepchem/models/tests/test_rnn.py

0 → 100644

+133 −0

Original line number	Diff line number	Diff line
		"""
		This is an RNN unit test written for deepchem/models/rnn.py based heavily on
		the GCNModel tests in Deepchem.
		"""

		import unittest
		import tempfile

		import numpy as np

		import deepchem as dc
		from deepchem.feat import MolGraphConvFeaturizer
		from deepchem.models import RNN
		from deepchem.models.tests.test_graph_models import get_dataset

		try:
		from tensorflow.keras.layers import Input, Dense, Reshape, Softmax, Dropout, Activation, Lambda
		import tensorflow.keras.layers as layers
		try:
		from collections.abc import Sequence as SequenceCollection
		except:
		from collections import Sequence as SequenceCollection
		has_dependencies = True
		except:
		has_dependencies = False

		@unittest.skipIf(not has_dependencies,
		'Please make sure tensorflow and collections are installed.')
		def test_rnn_regression():
		# load datasets
		featurizer = MolGraphConvFeaturizer() #TODO Possibly change featurizer
		tasks, dataset, transformers, metric = get_dataset(
		'regression', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model = RNN(
		mode='regression',
		n_dims=3,
		n_features=30,
		batch_size=10,
		learning_rate=0.003)

		# overfit test
		model.fit(dataset, nb_epoch=300)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean_absolute_error'] < 0.5

		# test on a small MoleculeNet dataset
		from deepchem.molnet import load_delaney

		tasks, all_dataset, transformers = load_delaney(featurizer=featurizer)
		train_set, _, _ = all_dataset
		model = dc.models.RNN(n_tasks=len(tasks))
		model.fit(train_set, nb_epoch=1)

		"""
		@unittest.skipIf(not has_dependencies,
		'Please make sure tensorflow and collections are installed.')
		def test_rnn_classification():
		# load datasets
		featurizer = MolGraphConvFeaturizer()
		tasks, dataset, transformers, metric = get_dataset(
		'classification', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model = GCNModel(
		mode='classification',
		n_tasks=n_tasks,
		number_atom_features=30,
		batch_size=10,
		learning_rate=0.0003)

		# overfit test
		model.fit(dataset, nb_epoch=70)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.85

		# test on a small MoleculeNet dataset
		from deepchem.molnet import load_bace_classification

		tasks, all_dataset, transformers = load_bace_classification(
		featurizer=featurizer)
		train_set, _, _ = all_dataset
		model = dc.models.GCNModel(
		mode='classification',
		n_tasks=len(tasks),
		graph_conv_layers=[2],
		residual=False,
		predictor_hidden_feats=2)
		model.fit(train_set, nb_epoch=1)
		"""
		"""
		@unittest.skipIf(not has_torch_and_dgl,
		'PyTorch, DGL, or DGL-LifeSci are not installed')
		def test_rnn_reload():
		# load datasets
		featurizer = MolGraphConvFeaturizer()
		tasks, dataset, transformers, metric = get_dataset(
		'classification', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model_dir = tempfile.mkdtemp()
		model = GCNModel(
		mode='classification',
		n_tasks=n_tasks,
		number_atom_features=30,
		model_dir=model_dir,
		batch_size=10,
		learning_rate=0.0003)

		model.fit(dataset, nb_epoch=70)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.85

		reloaded_model = GCNModel(
		mode='classification',
		n_tasks=n_tasks,
		number_atom_features=30,
		model_dir=model_dir,
		batch_size=10,
		learning_rate=0.0003)
		reloaded_model.restore()

		pred_mols = ["CCCC", "CCCCCO", "CCCCC"]
		X_pred = featurizer(pred_mols)
		random_dataset = dc.data.NumpyDataset(X_pred)
		original_pred = model.predict(random_dataset)
		reload_pred = reloaded_model.predict(random_dataset)
		assert np.all(original_pred == reload_pred)
		"""

Admin message