fix atomicconv slow tests (bbdb7035) · Commits · 钟慕尧 / deepchem

deepchem/models/atomic_conv.py

+1 −104

Original line number	Diff line number	Diff line
		@@ -17,102 +17,6 @@ from deepchem.utils.typing import KerasActivationFn, LossFn, OneOrMany

		logger = logging.getLogger(__name__)

		# class AtomicConvScore(Layer):
		# """The scoring function used by the atomic convolution models."""

		# def __init__(self, atom_types, layer_sizes, **kwargs):
		# super(AtomicConvScore, self).__init__(**kwargs)
		# self.atom_types = atom_types
		# self.layer_sizes = layer_sizes

		# def build(self, input_shape):
		# self.type_weights = []
		# self.type_biases = []
		# self.output_weights = []
		# self.output_biases = []
		# n_features = int(input_shape[0][-1])
		# layer_sizes = self.layer_sizes
		# num_layers = len(layer_sizes)
		# weight_init_stddevs = [1 / np.sqrt(x) for x in layer_sizes]
		# bias_init_consts = [0.0] * num_layers
		# for ind, atomtype in enumerate(self.atom_types):
		# prev_layer_size = n_features
		# self.type_weights.append([])
		# self.type_biases.append([])
		# self.output_weights.append([])
		# self.output_biases.append([])
		# for i in range(num_layers):
		# weight, bias = initializeWeightsBiases(
		# prev_layer_size=prev_layer_size,
		# size=layer_sizes[i],
		# weights=tf.random.truncated_normal(
		# shape=[prev_layer_size, layer_sizes[i]],
		# stddev=weight_init_stddevs[i]),
		# biases=tf.constant(
		# value=bias_init_consts[i], shape=[layer_sizes[i]]))
		# self.type_weights[ind].append(weight)
		# self.type_biases[ind].append(bias)
		# prev_layer_size = layer_sizes[i]
		# weight, bias = initializeWeightsBiases(prev_layer_size, 1)
		# self.output_weights[ind].append(weight)
		# self.output_biases[ind].append(bias)

		# def call(self, inputs):
		# frag1_layer, frag2_layer, complex_layer, frag1_z, frag2_z, complex_z = inputs
		# atom_types = self.atom_types
		# num_layers = len(self.layer_sizes)

		# def atomnet(current_input, atomtype):
		# prev_layer = current_input
		# for i in range(num_layers):
		# #layer = tf.nn.bias_add(
		# # tf.matmul(prev_layer, self.type_weights[atomtype][i]),
		# # self.type_biases[atomtype][i])
		# #layer = tf.nn.relu(layer)
		# layer = Dense(100)(prev_layer)
		# prev_layer = layer

		# #output_layer = tf.squeeze(
		# # tf.nn.bias_add(
		# # tf.matmul(prev_layer, self.output_weights[atomtype][0]),
		# # self.output_biases[atomtype][0]))
		# print("self.output_weights[atomtype][0].shape")
		# print(self.output_weights[atomtype][0].shape)
		# output_layer = Dense(
		# self.output_weights[atomtype][0].shape[0])(prev_layer)
		# return output_layer

		# frag1_zeros = tf.zeros_like(frag1_z, dtype=tf.float32)
		# frag2_zeros = tf.zeros_like(frag2_z, dtype=tf.float32)
		# complex_zeros = tf.zeros_like(complex_z, dtype=tf.float32)

		# frag1_atomtype_energy = []
		# frag2_atomtype_energy = []
		# complex_atomtype_energy = []

		# for ind, atomtype in enumerate(atom_types):
		# frag1_outputs = tf.map_fn(lambda x: atomnet(x, ind), frag1_layer)
		# frag2_outputs = tf.map_fn(lambda x: atomnet(x, ind), frag2_layer)
		# complex_outputs = tf.map_fn(lambda x: atomnet(x, ind), complex_layer)

		# cond = tf.equal(frag1_z, atomtype)
		# frag1_atomtype_energy.append(tf.where(cond, frag1_outputs, frag1_zeros))
		# cond = tf.equal(frag2_z, atomtype)
		# frag2_atomtype_energy.append(tf.where(cond, frag2_outputs, frag2_zeros))
		# cond = tf.equal(complex_z, atomtype)
		# complex_atomtype_energy.append(
		# tf.where(cond, complex_outputs, complex_zeros))

		# frag1_outputs = tf.add_n(frag1_atomtype_energy)
		# frag2_outputs = tf.add_n(frag2_atomtype_energy)
		# complex_outputs = tf.add_n(complex_atomtype_energy)

		# frag1_energy = tf.reduce_sum(frag1_outputs, 1)
		# frag2_energy = tf.reduce_sum(frag2_outputs, 1)
		# complex_energy = tf.reduce_sum(complex_outputs, 1)
		# binding_energy = complex_energy - (frag1_energy + frag2_energy)
		# return tf.expand_dims(binding_energy, axis=1)


		class AtomicConvModel(KerasModel):
		"""Implements an Atomic Convolution Model.
		@@ -260,12 +164,7 @@ class AtomicConvModel(KerasModel):
		regularizer = tf.keras.regularizers.l2(weight_decay_penalty)
		else:
		regularizer = None
		# score = AtomicConvScore(self.atom_types, layer_sizes)([
		# self._frag1_conv, self._frag2_conv, self._complex_conv, frag1_z,
		# frag2_z, complex_z
		# ])
		# print("score")
		# print(score)

		prev_layer = concat
		# dropout_switch = Input(shape=tuple())
		prev_size = concat.shape[0]
		@@ -278,8 +177,6 @@ class AtomicConvModel(KerasModel):
		layer = prev_layer
		if next_activation is not None:
		layer = Activation(next_activation)(layer)
		print("size")
		print(size)
		# layer = Dense(100)(layer)
		layer = Dense(
		size,

deepchem/models/tests/test_atomic_conv.py

+37 −17

Original line number	Diff line number	Diff line
		@@ -6,14 +6,26 @@ import os

		import pytest

		import deepchem
		import numpy as np
		import tensorflow as tf
		import unittest
		import numpy as np
		from deepchem.models import atomic_conv
		from deepchem.data import NumpyDataset
		from deepchem.feat import ComplexNeighborListFragmentAtomicCoordinates
		from deepchem.feat import AtomicConvFeaturizer


		def test_atomic_conv_initialize():
		"""Quick test of AtomicConv."""
		acm = atomic_conv.AtomicConvModel(
		n_tasks=1,
		batch_size=1,
		layer_sizes=[
		1,
		],
		frag1_num_atoms=5,
		frag2_num_atoms=5,
		complex_num_atoms=10)

		assert acm.complex_num_atoms == 10
		assert len(acm.atom_types) == 15


		@pytest.mark.slow
		@@ -26,6 +38,7 @@ def test_atomic_conv():
		atomic_convnet = atomic_conv.AtomicConvModel(
		n_tasks=1,
		batch_size=batch_size,
		layer_sizes=[10],
		frag1_num_atoms=5,
		frag2_num_atoms=5,
		complex_num_atoms=10,
		@@ -63,7 +76,6 @@ def test_atomic_conv():
		features = np.asarray(features)
		labels = np.random.rand(batch_size)
		train = NumpyDataset(features, labels)
		#atomic_convnet.fit(train, nb_epoch=300)
		atomic_convnet.fit(train, nb_epoch=150)
		print("labels")
		print(labels)
		@@ -75,8 +87,6 @@ def test_atomic_conv():
		@pytest.mark.slow
		def test_atomic_conv_variable():
		"""A simple test that initializes and fits an AtomicConvModel on variable input size."""
		# For simplicity, let's assume both molecules have same number of
		# atoms.
		frag1_num_atoms = 1000
		frag2_num_atoms = 1200
		complex_num_atoms = frag1_num_atoms + frag2_num_atoms
		@@ -84,6 +94,9 @@ def test_atomic_conv_variable():
		atomic_convnet = atomic_conv.AtomicConvModel(
		n_tasks=1,
		batch_size=batch_size,
		layer_sizes=[
		10,
		],
		frag1_num_atoms=frag1_num_atoms,
		frag2_num_atoms=frag2_num_atoms,
		complex_num_atoms=complex_num_atoms)
		@@ -108,6 +121,9 @@ def test_atomic_conv_variable():
		labels = np.zeros(batch_size)
		train = NumpyDataset(features, labels)
		atomic_convnet.fit(train, nb_epoch=1)
		preds = atomic_convnet.predict(train)
		assert preds.shape == (1, 1, 1)
		assert np.count_nonzero(preds) > 0


		@pytest.mark.slow
		@@ -117,28 +133,29 @@ def test_atomic_conv_with_feat():
		ligand_file = os.path.join(dir_path,
		"../../feat/tests/data/3zso_ligand_hyd.pdb")
		protein_file = os.path.join(dir_path,
		"../../feat/tests/data/3zso_protein.pdb")
		"../../feat/tests/data/3zso_protein_noH.pdb")
		# Pulled from PDB files. For larger datasets with more PDBs, would use
		# max num atoms instead of exact.
		frag1_num_atoms = 44 # for ligand atoms
		frag2_num_atoms = 2336 # for protein atoms
		complex_num_atoms = 2380 # in total
		frag2_num_atoms = 2334 # for protein atoms
		complex_num_atoms = 2378 # in total
		max_num_neighbors = 4
		# Cutoff in angstroms
		neighbor_cutoff = 4
		complex_featurizer = ComplexNeighborListFragmentAtomicCoordinates(
		frag1_num_atoms, frag2_num_atoms, complex_num_atoms, max_num_neighbors,
		neighbor_cutoff)
		complex_featurizer = AtomicConvFeaturizer(frag1_num_atoms, frag2_num_atoms,
		complex_num_atoms,
		max_num_neighbors, neighbor_cutoff)
		# arbitrary label
		labels = np.array([0])
		features, _ = complex_featurizer.featurize([ligand_file], [protein_file])
		dataset = deepchem.data.DiskDataset.from_numpy(features, labels)
		features = complex_featurizer.featurize([(ligand_file, protein_file)])
		dataset = NumpyDataset(features, labels)

		batch_size = 1
		print("Constructing Atomic Conv model")
		atomic_convnet = atomic_conv.AtomicConvModel(
		n_tasks=1,
		batch_size=batch_size,
		layer_sizes=[10],
		frag1_num_atoms=frag1_num_atoms,
		frag2_num_atoms=frag2_num_atoms,
		complex_num_atoms=complex_num_atoms)
		@@ -146,3 +163,6 @@ def test_atomic_conv_with_feat():
		print("About to call fit")
		# Run a fitting operation
		atomic_convnet.fit(dataset)
		preds = atomic_convnet.predict(dataset)
		assert preds.shape == (1, 1, 1)
		assert np.count_nonzero(preds) > 0

docs/source/api_reference/featurizers.rst

+3 −3

Original line number	Diff line number	Diff line
		@@ -229,10 +229,10 @@ RdkitGridFeaturizer
		:members:
		:inherited-members:

		AtomConvFeaturizer
		^^^^^^^^^^^^^^^^^^
		AtomicConvFeaturizer
		^^^^^^^^^^^^^^^^^^^^

		.. autoclass:: deepchem.feat.NeighborListComplexAtomicCoordinates
		.. autoclass:: deepchem.feat.AtomicConvFeaturizer
		:members:
		:inherited-members:

Admin message