comet-ml · jverre · Feb 1, 2025 · Feb 1, 2025
@@ -25,15 +25,19 @@ def from_rest_experiment_item_compare(
         cls,
         value: experiment_item_compare.ExperimentItemCompare,
     ) -> "ExperimentItemContent":
-        feedback_scores: List[FeedbackScoreDict] = [
-            {
-                "category_name": rest_feedback_score.category_name,
-                "name": rest_feedback_score.name,
-                "reason": rest_feedback_score.reason,
-                "value": rest_feedback_score.value,
-            }
-            for rest_feedback_score in value.feedback_scores
-        ]
+        if value.feedback_scores is None:
+            feedback_scores: List[FeedbackScoreDict] = []
+        else:
+            feedback_scores = [
+                {
+                    "category_name": rest_feedback_score.category_name,
+                    "name": rest_feedback_score.name,
+                    "reason": rest_feedback_score.reason,
+                    "value": rest_feedback_score.value,
+                }
+                for rest_feedback_score in value.feedback_scores
+            ]
+
         return ExperimentItemContent(
             id=value.id,
             trace_id=value.trace_id,

@@ -437,6 +437,107 @@ def get_dataset(self, name: str) -> dataset.Dataset:
 
         return dataset_
 
+    def get_datasets(
+        self,
+        max_results: int = 100,
+        sync_items: bool = True,
+    ) -> List[dataset.Dataset]:
+        """
+        Returns all datasets up to the specified limit.
+
+        Args:
+            max_results: The maximum number of datasets to return.
+            sync_items: Whether to sync the hashes of the dataset items. This is used to deduplicate items when fetching the dataset but it can be an expensive operation.
+
+        Returns:
+            List[dataset.Dataset]: A list of dataset objects that match the filter string.
+        """
+        page_size = 100
+        datasets_fern: List[dataset_public.DatasetPublic] = []
+
+        page = 1
+        while len(datasets_fern) < max_results:
+            page_datasets = self._rest_client.datasets.find_datasets(
+                page=page,
+                size=page_size,
+            )
+
+            if len(page_datasets.content) == 0:
+                break
+
+            datasets_fern.extend(page_datasets.content)
+            page += 1
+
+        datasets: List[dataset.Dataset] = []
+        for dataset_fern in datasets_fern:
+            dataset_ = dataset.Dataset(
+                name=dataset_fern.name,
+                description=dataset_fern.description,
+                rest_client=self._rest_client,
+            )
+
+            if sync_items:
+                dataset_.__internal_api__sync_hashes__()
+
+            datasets.append(dataset_)
+
+        return datasets
+
+    def get_dataset_experiments(
+        self,
+        dataset_name: str,
+        max_results: int = 100,
+    ) -> List[experiment.Experiment]:
+        """
+        Returns all experiments up to the specified limit.
+
+        Args:
+            dataset_name: The name of the dataset
+            max_results: The maximum number of experiments to return.
+
+        Returns:
+            List[experiment.Experiment]: A list of experiment objects.
+        """
+        try:
+            dataset_id = self._rest_client.datasets.get_dataset_by_identifier(
+                dataset_name=dataset_name
+            ).id
+        except ApiError as e:
+            if e.status_code == 404:
+                raise exceptions.DatasetNotFound(
+                    f"Dataset with the name {dataset_name} not found."
+                ) from e
+            raise
+
+        page_size = 100
+        experiments: List[experiment.Experiment] = []
+
+        page = 1
+        while len(experiments) < max_results:
+            page_experiments = self._rest_client.experiments.find_experiments(
+                page=page,
+                size=page_size,
+                dataset_id=dataset_id,
+            )
+
+            if len(page_experiments.content) == 0:
+                break
+
+            for experiment_ in page_experiments.content:
+                experiments.append(
+                    experiment.Experiment(
+                        id=experiment_.id,
+                        name=experiment_.name,
+                        dataset_name=experiment_.dataset_name,
+                        rest_client=self._rest_client,
+                        # TODO: add prompt if exists
+                    )
+                )
+
+            page += 1
+
+        return experiments
+
     def delete_dataset(self, name: str) -> None:
         """
         Delete dataset by name

@@ -40,3 +40,7 @@ def __str__(self) -> str:
 
 class ExperimentNotFound(OpikException):
     pass
+
+
+class DatasetNotFound(OpikException):
+    pass
@@ -393,3 +393,38 @@ def test_experiment__get_experiment_by_name__experiment_not_found__ExperimentNot
 ):
     with pytest.raises(exceptions.ExperimentNotFound):
         opik_client.get_experiment_by_id("not-existing-name")
+
+
+def test_experiment__get_experiment_items__no_feedback_scores(
+    opik_client: opik.Opik, dataset_name: str, experiment_name: str
+):
+    dataset = opik_client.create_dataset(dataset_name)
+
+    dataset.insert(
+        [
+            {
+                "input": {"question": "What is the of capital of France?"},
+                "expected_model_output": {"output": "Paris"},
+            },
+        ]
+    )
+
+    def task(item: Dict[str, Any]) -> Dict[str, Any]:
+        return {
+            "output": "Paris",
+        }
+
+    opik.evaluate(
+        dataset=dataset,
+        task=task,
+        scoring_metrics=[],
+        experiment_name=experiment_name,
+    )
+
+    opik.flush_tracker()
+
+    experiment = opik_client.get_experiment_by_name(experiment_name)
+    items = experiment.get_items()
+
+    assert len(items) == 1
+    assert items[0].feedback_scores == []
-Original file line number
+Diff line change
@@ Expand Up / @@ -40,3 +40,7 @@ def __str__(self) -> str: @@
     class ExperimentNotFound(OpikException):
         pass
+    class DatasetNotFound(OpikException):
+        pass