Fix some more broken model tests (1cee7b7a) · Commits · 钟慕尧 / deepchem

deepchem/hyperparameters/tests/test_hyperparam_opt.py

+9 −25

Original line number	Diff line number	Diff line
		@@ -23,6 +23,7 @@ from deepchem import metrics
		from deepchem.metrics import Metric
		from deepchem.models.multitask import SingletaskToMultitask
		from sklearn.ensemble import RandomForestClassifier
		from sklearn.ensemble import RandomForestRegressor
		from deepchem.datasets import Dataset
		from deepchem.hyperparameters import HyperparamOpt
		from deepchem.models.keras_models.fcnet import MultiTaskDNN
		@@ -33,19 +34,6 @@ from deepchem.splits import ScaffoldSplitter
		import tensorflow as tf
		from keras import backend as K

		def rf_model_builder(tasks, task_types, params_dict, model_dir, verbosity=None):
		"""Builds random forests given hyperparameters.

		Last two arguments only for tensorflow models and ignored.
		"""
		n_estimators = params_dict["n_estimators"]
		max_features = params_dict["max_features"]
		return SklearnModel(
		tasks, task_types, params_dict, model_dir,
		mode="regression",
		model_instance=RandomForestRegressor(n_estimators=n_estimators,
		max_features=max_features))

		class TestHyperparamOptAPI(TestAPI):
		"""
		Test hyperparameter optimization API.
		@@ -54,8 +42,6 @@ class TestHyperparamOptAPI(TestAPI):
		"""Test of hyperparam_opt with singletask RF ECFP regression API."""
		featurizer = CircularFingerprint(size=1024)
		tasks = ["log-solubility"]
		task_type = "regression"
		task_types = {task: task_type for task in tasks}
		input_file = os.path.join(self.current_dir, "example.csv")
		loader = DataLoader(tasks=tasks,
		smiles_field=self.smiles_field,
		@@ -67,23 +53,21 @@ class TestHyperparamOptAPI(TestAPI):
		train_dataset, valid_dataset, test_dataset = splitter.train_valid_test_split(
		dataset, self.train_dir, self.valid_dir, self.test_dir)

		input_transformers = []
		output_transformers = [
		transformers = [
		NormalizationTransformer(transform_y=True, dataset=train_dataset)]
		transformers = input_transformers + output_transformers
		for dataset in [train_dataset, test_dataset]:
		for transformer in transformers:
		transformer.transform(dataset)
		params_dict = {
		"n_estimators": [10, 100],
		"max_features": ["auto"],
		"data_shape": train_dataset.get_data_shape()
		}

		params_dict = {"n_estimators": [10, 100]}
		metric = Metric(metrics.r2_score)
		def rf_model_builder(model_params, model_dir):
		sklearn_model = RandomForestRegressor(**model_params)
		return SklearnModel(sklearn_model, model_dir)

		optimizer = HyperparamOpt(rf_model_builder, tasks, task_types, verbosity="low")
		optimizer = HyperparamOpt(rf_model_builder, verbosity="low")
		best_model, best_hyperparams, all_results = optimizer.hyperparam_search(
		params_dict, train_dataset, valid_dataset, output_transformers,
		params_dict, train_dataset, valid_dataset, transformers,
		metric, logdir=None)

		def test_singletask_to_multitask_sklearn_hyperparam_opt(self):

deepchem/models/tests/test_reload.py

+8 −8

Original line number	Diff line number	Diff line
		@@ -129,21 +129,21 @@ class TestModelReload(TestAPI):
		verbosity = "high"
		classification_metric = Metric(metrics.accuracy_score, verbosity=verbosity)

		def tf_model_builder(logdir, train):
		return TensorflowMultiTaskClassifier(
		n_tasks, n_features, logdir, dropouts=[0.], train=train)
		model = TensorflowModel(
		tf_model_builder, self.model_dir, verbosity=verbosity)
		tensorflow_model = TensorflowMultiTaskClassifier(
		n_tasks, n_features, self.model_dir, dropouts=[0.],
		verbosity=verbosity)
		model = TensorflowModel(tensorflow_model, self.model_dir)

		# Fit trained model
		model.fit(dataset)
		model.save()

		# Load trained model
		reloaded_model = TensorflowModel(
		tf_model_builder, self.model_dir, verbosity=verbosity)
		reloaded_tensorflow_model = TensorflowMultiTaskClassifier(
		n_tasks, n_features, self.model_dir, dropouts=[0.],
		verbosity=verbosity)
		reloaded_model = TensorflowModel(reloaded_tensorflow_model, self.model_dir)
		reloaded_model.reload()
		assert reloaded_model.eval_model._restored_model

		# Eval model on train
		transformers = []

Admin message