Fixed failing test cases (cb4ea667) · Commits · 钟慕尧 / deepchem

deepchem/utils/evaluate.py

+4 −1

Original line number	Diff line number	Diff line
		@@ -207,6 +207,9 @@ class GeneratorEvaluator(object):
		y_pred = undo_transforms(y_pred, self.output_transformers)
		if len(w) != 0:
		w = np.array(w)
		if np.prod(w.shape) == y.shape[0]:
		w = np.reshape(w, newshape=(y.shape[0], 1))
		else:
		w = np.reshape(w, newshape=y.shape)

		# Compute multitask metrics

deepchem/utils/test/test_generator_evaluator.py

+34 −98

Original line number	Diff line number	Diff line
		@@ -2,11 +2,10 @@ from unittest import TestCase

		import deepchem as dc
		import numpy as np
		import tensorflow as tf
		from deepchem.data import NumpyDataset
		from deepchem.data.datasets import Databag
		from deepchem.models.tensorgraph.layers import Dense, ReduceMean, SoftMax, SoftMaxCrossEntropy
		from deepchem.models.tensorgraph.layers import Feature, Label, Reshape
		from deepchem.models.tensorgraph.layers import ReduceSquareDifference
		from tensorflow.keras import layers
		from nose.tools import assert_true
		from flaky import flaky

		@@ -30,26 +29,24 @@ class TestGeneratorEvaluator(TestCase):
		y = np.stack([y1, y2], axis=1)
		dataset = NumpyDataset(X, y)

		features = Feature(shape=(None, n_features))
		label = Label(shape=(None, n_tasks, n_classes))
		dense = Dense(out_channels=n_tasks * n_classes, in_layers=[features])
		logits = Reshape(shape=(None, n_tasks, n_classes), in_layers=dense)
		output = SoftMax(in_layers=[logits])
		smce = SoftMaxCrossEntropy(in_layers=[label, logits])
		total_loss = ReduceMean(in_layers=smce)

		tg = dc.models.TensorGraph(learning_rate=0.01, batch_size=n_data_points)
		tg.add_output(output)
		tg.set_loss(total_loss)

		tg.fit(dataset, nb_epoch=1000)
		features = layers.Input(shape=(n_data_points // 2, n_features))
		dense = layers.Dense(n_tasks * n_classes)(features)
		logits = layers.Reshape((n_tasks, n_classes))(dense)
		output = layers.Softmax()(logits)
		keras_model = tf.keras.Model(inputs=features, outputs=[output, logits])
		model = dc.models.KerasModel(
		keras_model,
		dc.models.losses.SoftmaxCrossEntropy(),
		output_types=['prediction', 'loss'],
		learning_rate=0.01,
		batch_size=n_data_points)

		model.fit(dataset, nb_epoch=1000)
		metric = dc.metrics.Metric(
		dc.metrics.roc_auc_score, np.mean, mode="classification")

		scores = tg.evaluate_generator(
		tg.default_generator(dataset), [metric],
		labels=[label],
		per_task_metrics=True)
		scores = model.evaluate_generator(
		model.default_generator(dataset), [metric], per_task_metrics=True)
		scores = list(scores[1].values())
		# Loosening atol to see if tests stop failing sporadically
		assert_true(np.all(np.isclose(scores, [1.0, 1.0], atol=0.50)))
		@@ -66,25 +63,19 @@ class TestGeneratorEvaluator(TestCase):
		y = np.concatenate((class_0, class_1))
		dataset = NumpyDataset(X, y)

		features = Feature(shape=(None, n_features))
		label = Label(shape=(None, 2))
		dense = Dense(out_channels=2, in_layers=[features])
		output = SoftMax(in_layers=[dense])
		smce = SoftMaxCrossEntropy(in_layers=[label, dense])
		total_loss = ReduceMean(in_layers=smce)
		features = layers.Input(shape=(n_features,))
		dense = layers.Dense(2)(features)
		output = layers.Softmax()(dense)
		keras_model = tf.keras.Model(inputs=features, outputs=[output])
		model = dc.models.KerasModel(
		keras_model, dc.models.losses.SoftmaxCrossEntropy(), learning_rate=0.1)

		tg = dc.models.TensorGraph(learning_rate=0.1)
		tg.add_output(output)
		tg.set_loss(total_loss)

		tg.fit(dataset, nb_epoch=1000)
		model.fit(dataset, nb_epoch=1000)
		metric = dc.metrics.Metric(
		dc.metrics.roc_auc_score, np.mean, mode="classification")

		scores = tg.evaluate_generator(
		tg.default_generator(dataset), [metric],
		labels=[label],
		per_task_metrics=True)
		scores = model.evaluate_generator(
		model.default_generator(dataset), [metric], per_task_metrics=True)
		scores = list(scores[1].values())
		assert_true(np.isclose(scores, [1.0], atol=0.05))

		@@ -101,73 +92,18 @@ class TestGeneratorEvaluator(TestCase):
		y = np.stack([y1, y2], axis=1)
		dataset = NumpyDataset(X, y)

		features = Feature(shape=(None, n_features))
		label = Label(shape=(None, n_tasks))
		dense = Dense(out_channels=n_tasks, in_layers=[features])
		loss = ReduceSquareDifference(in_layers=[dense, label])

		tg = dc.models.TensorGraph(random_seed=random_seed, learning_rate=0.1)
		tg.add_output(dense)
		tg.set_loss(loss)
		features = layers.Input(shape=(n_features,))
		dense = layers.Dense(n_tasks)(features)
		keras_model = tf.keras.Model(inputs=features, outputs=[dense])
		model = dc.models.KerasModel(
		keras_model, dc.models.losses.L2Loss(), learning_rate=0.1)

		tg.fit(dataset, nb_epoch=1000)
		model.fit(dataset, nb_epoch=1000)
		metric = [
		dc.metrics.Metric(
		dc.metrics.mean_absolute_error, np.mean, mode="regression"),
		]
		scores = tg.evaluate_generator(
		tg.default_generator(dataset),
		metric,
		labels=[label],
		per_task_metrics=True)
		scores = model.evaluate_generator(
		model.default_generator(dataset), metric, per_task_metrics=True)
		scores = list(scores[1].values())
		assert_true(np.all(np.isclose(scores, [0.0, 0.0], atol=1.0)))

		def test_compute_model_performance_singletask_regressor(self):
		n_data_points = 20
		n_features = 2

		X = np.random.rand(n_data_points, n_features)
		y1 = np.expand_dims(np.array([0.5 for x in range(n_data_points)]), axis=-1)
		X = NumpyDataset(X)
		ys = [NumpyDataset(y1)]

		databag = Databag()

		features = Feature(shape=(None, n_features))
		databag.add_dataset(features, X)

		outputs = []
		losses = []
		labels = []
		for i in range(1):
		label = Label(shape=(None, 1))
		dense = Dense(out_channels=1, in_layers=[features])
		loss = ReduceSquareDifference(in_layers=[dense, label])

		outputs.append(dense)
		losses.append(loss)
		labels.append(label)
		databag.add_dataset(label, ys[i])

		total_loss = ReduceMean(in_layers=losses)

		tg = dc.models.TensorGraph(mode="regression", learning_rate=0.1)
		for output in outputs:
		tg.add_output(output)
		tg.set_loss(total_loss)

		tg.fit_generator(
		databag.iterbatches(
		epochs=1000, batch_size=tg.batch_size, pad_batches=True))
		metric = [
		dc.metrics.Metric(
		dc.metrics.mean_absolute_error, np.mean, mode="regression"),
		]
		scores = tg.evaluate_generator(
		databag.iterbatches(batch_size=tg.batch_size),
		metric,
		labels=labels,
		per_task_metrics=True)
		scores = list(scores[1].values())
		assert_true(np.all(np.isclose(scores, [0.0], atol=0.5)))

Admin message