add load model for train and fix validate anchor gene error

Files changed (2) hide show

geneformer/in_silico_perturber.py CHANGED Viewed

@@ -263,7 +263,7 @@ class InSilicoPerturber:
                 "Current valid options for 'perturb_type': 'delete' or 'overexpress'"
             )
             raise
-        if (self.combos > 0) and (self.anchor_token is None):
             logger.error(
                 "Combination perturbation without anchor gene is currently under development. "
                 "Currently, must provide anchor gene for combination perturbation."
@@ -416,7 +416,9 @@ class InSilicoPerturber:
         )
         ### load model and define parameters ###
-        model = pu.load_model(self.model_type, self.num_classes, model_directory)
         self.max_len = pu.get_model_input_size(model)
         layer_to_quant = pu.quant_layers(model) + self.emb_layer

                 "Current valid options for 'perturb_type': 'delete' or 'overexpress'"
             )
             raise
+        if (self.combos > 0) and (self.anchor_gene is None):
             logger.error(
                 "Combination perturbation without anchor gene is currently under development. "
                 "Currently, must provide anchor gene for combination perturbation."
         )
         ### load model and define parameters ###
+        model = pu.load_model(
+            self.model_type, self.num_classes, model_directory, mode="eval"
+        )
         self.max_len = pu.get_model_input_size(model)
         layer_to_quant = pu.quant_layers(model) + self.emb_layer

geneformer/perturber_utils.py CHANGED Viewed

@@ -108,28 +108,36 @@ def slice_by_inds_to_perturb(filtered_input_data, cell_inds_to_perturb):
 # load model to GPU
-def load_model(model_type, num_classes, model_directory):
     if model_type == "Pretrained":
         model = BertForMaskedLM.from_pretrained(
-            model_directory, output_hidden_states=True, output_attentions=False
         )
     elif model_type == "GeneClassifier":
         model = BertForTokenClassification.from_pretrained(
             model_directory,
             num_labels=num_classes,
-            output_hidden_states=True,
             output_attentions=False,
         )
     elif model_type == "CellClassifier":
         model = BertForSequenceClassification.from_pretrained(
             model_directory,
             num_labels=num_classes,
-            output_hidden_states=True,
             output_attentions=False,
         )
-    # put the model in eval mode for fwd pass
-    model.eval()
-    model = model.to("cuda:0")
     return model

 # load model to GPU
+def load_model(model_type, num_classes, model_directory, mode):
+    if mode == "eval":
+        output_hidden_states = True
+    elif mode == "train":
+        output_hidden_states = False
     if model_type == "Pretrained":
         model = BertForMaskedLM.from_pretrained(
+            model_directory,
+            output_hidden_states=output_hidden_states,
+            output_attentions=False,
         )
     elif model_type == "GeneClassifier":
         model = BertForTokenClassification.from_pretrained(
             model_directory,
             num_labels=num_classes,
+            output_hidden_states=output_hidden_states,
             output_attentions=False,
         )
     elif model_type == "CellClassifier":
         model = BertForSequenceClassification.from_pretrained(
             model_directory,
             num_labels=num_classes,
+            output_hidden_states=output_hidden_states,
             output_attentions=False,
         )
+    # if eval mode, put the model in eval mode for fwd pass
+    if mode == "eval":
+        model.eval()
+    model = model.to("cuda")
     return model