Update (494ecb96) · Commits · 钟慕尧 / deepchem

deepchem/models/tests/test_mpnn.py

+95 −0

Original line number	Diff line number	Diff line
		import unittest
		import tempfile

		import numpy as np

		import deepchem as dc
		from deepchem.feat import MolGraphConvFeaturizer
		from deepchem.models.torch_models import MPNNModel
		from deepchem.models.tests.test_graph_models import get_dataset

		try:
		import dgl
		import dgllife
		import torch
		has_torch_and_dgl = True
		except:
		has_torch_and_dgl = False


		@unittest.skipIf(not has_torch_and_dgl,
		'PyTorch, DGL, or DGL-LifeSci are not installed')
		def test_mpnn_regression():
		# load datasets
		featurizer = MolGraphConvFeaturizer(use_edges=True)
		tasks, dataset, transformers, metric = get_dataset(
		'regression', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model = MPNNModel(mode='regression', n_tasks=n_tasks, batch_size=10)

		# overfit test
		model.fit(dataset, nb_epoch=100)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean_absolute_error'] < 0.5


		@unittest.skipIf(not has_torch_and_dgl,
		'PyTorch, DGL, or DGL-LifeSci are not installed')
		def test_mpnn_classification():
		# load datasets
		featurizer = MolGraphConvFeaturizer(use_edges=True)
		tasks, dataset, transformers, metric = get_dataset(
		'classification', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model = MPNNModel(
		mode='classification',
		n_tasks=n_tasks,
		batch_size=10,
		learning_rate=0.001)

		# overfit test
		model.fit(dataset, nb_epoch=100)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.85


		@unittest.skipIf(not has_torch_and_dgl,
		'PyTorch, DGL, or DGL-LifeSci are not installed')
		def test_mpnn_reload():
		# load datasets
		featurizer = MolGraphConvFeaturizer(use_edges=True)
		tasks, dataset, transformers, metric = get_dataset(
		'classification', featurizer=featurizer)

		# initialize models
		n_tasks = len(tasks)
		model_dir = tempfile.mkdtemp()
		model = MPNNModel(
		mode='classification',
		n_tasks=n_tasks,
		model_dir=model_dir,
		batch_size=10,
		learning_rate=0.001)

		model.fit(dataset, nb_epoch=100)
		scores = model.evaluate(dataset, [metric], transformers)
		assert scores['mean-roc_auc_score'] >= 0.85

		reloaded_model = MPNNModel(
		mode='classification',
		n_tasks=n_tasks,
		model_dir=model_dir,
		batch_size=10,
		learning_rate=0.001)
		reloaded_model.restore()

		pred_mols = ["CCCC", "CCCCCO", "CCCCC"]
		X_pred = featurizer(pred_mols)
		random_dataset = dc.data.NumpyDataset(X_pred)
		original_pred = model.predict(random_dataset)
		reload_pred = reloaded_model.predict(random_dataset)
		assert np.all(original_pred == reload_pred)

Admin message