Enhancing user experience for humaneval benchmark #65

bhanvimenghani · 2024-11-22T07:19:57Z

This pr adds a Cleanup script, a Run script, enables user to provide input in terms of duration for how long it wants to keep the workload running. This has been tested on the nerc cluster.
This is how the user experience would look like!

kusumachalasani · 2024-12-05T05:03:15Z

human-eval-benchmark/Readme.md

@@ -21,6 +21,11 @@ Towards the end of the script B the user is prompted to fill the run duration, w

 ## 2. Automated Job

-In this approach we already have a combined script named `script.py`, and a Docker file which is used to create this docker image `quay.io/kruizehub/human-eval-deployment` which is used in the `job.yaml` file.
+To run the benchmark in an automated way the user simply needs to login to the relevent Openshift AI cluster, create a namespace or you can use the default namespace. Set your desired environment variable in `job.yaml`, you have number of prompts or duration to choose from. If num_prompts and duration_in_seconds both are set num_prompts has a higher precedence. Apply `pcv.yaml` followed by applying `job.yaml`. This would deploy the humaneval benchamrk in the specified namespace.


Typo for pvc.yaml

kusumachalasani · 2024-12-05T05:05:16Z

human-eval-benchmark/run_humaneval.sh

+
+JOB_YAML=./manifests/job.yaml
+JOB_NAME=human-eval-deployment-job
+NAMESPACE=default


Can you provide an option to change the namespace as parameter. By default, the namespace can be 'default'

@kusumachalasani added it!

kusumachalasani

lgtm!

bhanvimenghani self-assigned this Nov 22, 2024

bhanvimenghani requested a review from kusumachalasani November 22, 2024 07:20

bhanvimenghani force-pushed the human-eval-timestamp branch from cbda7cf to ca9a6b2 Compare November 22, 2024 07:45

bhanvimenghani requested a review from dinogun November 26, 2024 09:45

bhanvimenghani mentioned this pull request Dec 2, 2024

Corresponding updates for human-eval benchmark kruize/kruize-demos#113

Open

kusumachalasani reviewed Dec 5, 2024

View reviewed changes

bhanvimenghani force-pushed the human-eval-timestamp branch from 490bd3f to d59c30f Compare December 5, 2024 08:26

bhanvimenghani added 5 commits December 6, 2024 12:57

adds timestamp automation

40a9537

adds cmd line options

6f814e7

use can specify nsp in run-script

ab93d40

makes readme more verbose

befbcfe

rebase

0a73399

bhanvimenghani force-pushed the human-eval-timestamp branch from 60d5dfd to 0a73399 Compare December 6, 2024 07:33

bhanvimenghani added 2 commits December 6, 2024 15:12

make it just human-eval

d3f6437

push deleted files

e349a20

kusumachalasani approved these changes Dec 6, 2024

View reviewed changes

change nsp in pvc yaml too

bad7ce5

bhanvimenghani force-pushed the human-eval-timestamp branch from 6ec5f96 to bad7ce5 Compare December 9, 2024 11:19

rbadagandi1 added this to the Kruize 0.3 Release milestone Dec 13, 2024

dinogun merged commit 54c09bd into kruize:master Dec 13, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Enhancing user experience for humaneval benchmark #65

Enhancing user experience for humaneval benchmark #65

bhanvimenghani commented Nov 22, 2024 •

edited

Loading

kusumachalasani Dec 5, 2024

kusumachalasani Dec 5, 2024

bhanvimenghani Dec 5, 2024

kusumachalasani left a comment

Enhancing user experience for humaneval benchmark #65

Enhancing user experience for humaneval benchmark #65

Conversation

bhanvimenghani commented Nov 22, 2024 • edited Loading

kusumachalasani Dec 5, 2024

Choose a reason for hiding this comment

kusumachalasani Dec 5, 2024

Choose a reason for hiding this comment

bhanvimenghani Dec 5, 2024

Choose a reason for hiding this comment

kusumachalasani left a comment

Choose a reason for hiding this comment

bhanvimenghani commented Nov 22, 2024 •

edited

Loading