Adding first failing test of weave featurization with max pairs. (d4804caa) · Commits · 钟慕尧 / deepchem

deepchem/feat/tests/test_weave.py

+19 −2

Original line number	Diff line number	Diff line
		@@ -33,7 +33,7 @@ def test_max_pair_distance_pairs():
		assert pair_edges.shape == (2, 9)


		def test_single_carbon():
		def test_weave_single_carbon():
		"""Test that single carbon atom is featurized properly."""
		mols = ['C']
		featurizer = dc.feat.WeaveFeaturizer()
		@@ -52,7 +52,7 @@ def test_single_carbon():
		assert mol.get_pair_features().shape == (1 * 1, 14)


		def test_alkane():
		def test_weave_alkane():
		"""Test on simple alkane"""
		mols = ['CCC']
		featurizer = dc.feat.WeaveFeaturizer()
		@@ -69,6 +69,23 @@ def test_alkane():
		assert mol.get_pair_features().shape == (3 * 3, 14)


		def test_weave_alkane_max_pairs():
		"""Test on simple alkane with max pairs distance cutoff"""
		mols = ['CCC']
		featurizer = dc.feat.WeaveFeaturizer(max_pair_distance=1)
		mol_list = featurizer.featurize(mols)
		mol = mol_list[0]

		# 3 carbonds in alkane
		assert mol.get_num_atoms() == 3

		# Test feature sizes
		assert mol.get_num_features() == 75

		# Should be a 3x3 interaction grid
		assert mol.get_pair_features().shape == (7, 14)


		def test_carbon_nitrogen():
		"""Test on carbon nitrogen molecule"""
		# Note there is a central nitrogen of degree 4, with 4 carbons

deepchem/models/tests/test_graph_models.py

+0 −45

Original line number	Diff line number	Diff line
		@@ -141,51 +141,6 @@ def test_graph_conv_atom_features():
		y_pred1 = model.predict(dataset)


		@flaky
		@pytest.mark.slow
		def test_weave_model():
		tasks, dataset, transformers, metric = get_dataset('classification', 'Weave')

		batch_size = 20
		model = WeaveModel(
		len(tasks),
		batch_size=batch_size,
		mode='classification',
		fully_connected_layer_sizes=[2000, 1000],
		batch_normalize=True,
		batch_normalize_kwargs={
		"fused": False,
		"trainable": True,
		"renorm": True
		},
		learning_rage=0.0005)
		model.fit(dataset, nb_epoch=200)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.9


		@pytest.mark.slow
		def test_weave_regression_model():
		import numpy as np
		import tensorflow as tf
		tf.random.set_seed(123)
		np.random.seed(123)
		tasks, dataset, transformers, metric = get_dataset('regression', 'Weave')

		batch_size = 10
		model = WeaveModel(
		len(tasks),
		batch_size=batch_size,
		mode='regression',
		batch_normalize=False,
		fully_connected_layer_sizes=[],
		dropouts=0,
		learning_rate=0.0005)
		model.fit(dataset, nb_epoch=200)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean_absolute_error'] < 0.1


		@pytest.mark.slow
		def test_dag_model():
		tasks, dataset, transformers, metric = get_dataset('classification',

deepchem/models/tests/test_overfit.py

+0 −4

Original line number	Diff line number	Diff line
		@@ -2,10 +2,6 @@
		Tests to make sure deepchem models can overfit on tiny datasets.
		"""

		__author__ = "Bharath Ramsundar"
		__copyright__ = "Copyright 2016, Stanford University"
		__license__ = "MIT"

		import os

		import numpy as np

deepchem/models/tests/test_weave_models.py

0 → 100644

+109 −0

Original line number	Diff line number	Diff line
		import unittest
		import os
		import numpy as np
		import pytest
		import scipy

		import deepchem as dc
		from deepchem.data import NumpyDataset
		from deepchem.models import GraphConvModel, DAGModel, WeaveModel, MPNNModel
		from deepchem.molnet import load_bace_classification, load_delaney
		from deepchem.feat import ConvMolFeaturizer

		from flaky import flaky


		def get_dataset(mode='classification', featurizer='GraphConv', num_tasks=2):
		data_points = 20
		if mode == 'classification':
		tasks, all_dataset, transformers = load_bace_classification(featurizer)
		else:
		tasks, all_dataset, transformers = load_delaney(featurizer)

		train, valid, test = all_dataset
		for i in range(1, num_tasks):
		tasks.append("random_task")
		w = np.ones(shape=(data_points, len(tasks)))

		if mode == 'classification':
		y = np.random.randint(0, 2, size=(data_points, len(tasks)))
		metric = dc.metrics.Metric(
		dc.metrics.roc_auc_score, np.mean, mode="classification")
		else:
		y = np.random.normal(size=(data_points, len(tasks)))
		metric = dc.metrics.Metric(
		dc.metrics.mean_absolute_error, mode="regression")

		ds = NumpyDataset(train.X[:data_points], y, w, train.ids[:data_points])

		return tasks, ds, transformers, metric


		@flaky
		@pytest.mark.slow
		def test_weave_model():
		tasks, dataset, transformers, metric = get_dataset('classification', 'Weave')

		batch_size = 20
		model = WeaveModel(
		len(tasks),
		batch_size=batch_size,
		mode='classification',
		fully_connected_layer_sizes=[2000, 1000],
		batch_normalize=True,
		batch_normalize_kwargs={
		"fused": False,
		"trainable": True,
		"renorm": True
		},
		learning_rage=0.0005)
		model.fit(dataset, nb_epoch=200)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.9


		@pytest.mark.slow
		def test_weave_regression_model():
		import numpy as np
		import tensorflow as tf
		tf.random.set_seed(123)
		np.random.seed(123)
		tasks, dataset, transformers, metric = get_dataset('regression', 'Weave')

		batch_size = 10
		model = WeaveModel(
		len(tasks),
		batch_size=batch_size,
		mode='regression',
		batch_normalize=False,
		fully_connected_layer_sizes=[],
		dropouts=0,
		learning_rate=0.0005)
		model.fit(dataset, nb_epoch=200)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean_absolute_error'] < 0.1


		def test_weave_fit_simple():
		featurizer = dc.feat.WeaveFeaturizer()
		X = featurizer(["C", "CCC"])
		y = np.random.randint(2, size=(2,))
		dataset = dc.data.NumpyDataset(X, y)
		tasks, dataset, transformers, metric = get_dataset('classification', 'Weave')

		batch_size = 20
		model = WeaveModel(
		len(tasks),
		batch_size=batch_size,
		mode='classification',
		fully_connected_layer_sizes=[2000, 1000],
		batch_normalize=True,
		batch_normalize_kwargs={
		"fused": False,
		"trainable": True,
		"renorm": True
		},
		learning_rage=0.0005)
		model.fit(dataset, nb_epoch=200)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.9

Admin message