broadinstitute · hanars · Aug 3, 2023 · Aug 2, 2023 · Aug 2, 2023
diff --git a/hail_search/hail_search_query.py b/hail_search/hail_search_query.py
@@ -65,27 +65,24 @@ def _format_population_config(cls, pop_config):
 
     @property
     def annotation_fields(self):
-        ht_globals = {k: hl.eval(self._ht[k]) for k in self.GLOBALS}
-        enums = ht_globals.pop('enums')
-
         annotation_fields = {
             'populations': lambda r: hl.struct(**{
                 population: self.population_expression(r, population) for population in self.POPULATIONS.keys()
             }),
             'predictions': lambda r: hl.struct(**{
-                prediction: hl.array(enums[path.source][path.field])[r[path.source][f'{path.field}_id']]
-                if enums.get(path.source, {}).get(path.field) else r[path.source][path.field]
+                prediction: hl.array(self._enums[path.source][path.field])[r[path.source][f'{path.field}_id']]
+                if self._enums.get(path.source, {}).get(path.field) else r[path.source][path.field]
                 for prediction, path in self.PREDICTION_FIELDS_CONFIG.items()
             }),
             'transcripts': lambda r: hl.or_else(
                 r.sorted_transcript_consequences, hl.empty_array(r.sorted_transcript_consequences.dtype.element_type)
             ).map(
-                lambda t: self._enum_field(t, enums['sorted_transcript_consequences'], **self._format_transcript_args())
+                lambda t: self._enum_field(t, self._enums['sorted_transcript_consequences'], **self._format_transcript_args())
             ).group_by(lambda t: t.geneId),
         }
         annotation_fields.update(self.BASE_ANNOTATION_FIELDS)
 
-        format_enum = lambda k, enum_config: lambda r: self._enum_field(r[k], enums[k], ht_globals=ht_globals, **enum_config)
+        format_enum = lambda k, enum_config: lambda r: self._enum_field(r[k], self._enums[k], ht_globals=self._globals, **enum_config)
         annotation_fields.update({
             enum_config.get('response_key', k): format_enum(k, enum_config)
             for k, enum_config in self.ENUM_ANNOTATION_FIELDS.items()
@@ -140,6 +137,8 @@ def __init__(self, data_type, sample_data, genome_version, sort=XPOS, num_result
         self._sort = sort
         self._num_results = num_results
         self._ht = None
+        self._enums = None
+        self._globals = None
 
         self._load_filtered_table(data_type, sample_data, **kwargs)
 
@@ -190,8 +189,11 @@ def import_filtered_table(self, data_type, sample_data, **kwargs):
         annotation_ht_query_result = hl.query_table(
             annotations_ht_path, families_ht.key).first().drop(*families_ht.key)
         ht = families_ht.annotate(**annotation_ht_query_result)
-        # Add globals
-        ht = ht.join(hl.read_table(annotations_ht_path).head(0).select().select_globals(*self.GLOBALS), how='left')
+
+        # Get globals
+        annotation_globals_ht = hl.read_table(annotations_ht_path).head(0).select()
+        self._globals = {k: hl.eval(annotation_globals_ht[k]) for k in self.GLOBALS}
+        self._enums = self._globals.pop('enums')
 
         self._ht = ht.transmute(
             genotypes=ht.family_entries.flatmap(lambda x: x).filter(