Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Benchmark Ilościowy w JP #58

Open
4 tasks
Kleczyk opened this issue Dec 1, 2023 · 0 comments
Open
4 tasks

Benchmark Ilościowy w JP #58

Kleczyk opened this issue Dec 1, 2023 · 0 comments

Comments

@Kleczyk
Copy link
Contributor

Kleczyk commented Dec 1, 2023

Jaki jest cel tego tego zadania

Ocena modelu na podstawie dużej ilości pytań w JP porówanie podobieństw odpowidzi LLM do oreginalnej

Jak wygląda rozwiązanie?

Rozwiązanie polega na stworzeniu gotowego skryptu, który będzie działał w sposób ciągły. Skrypt ten będzie pobierał dane z bazy danych, przeprowadzał benchmark na bieżąco, rejestrował parametry, odpowiedzi modeli i przesyłał te dane do bazy danych.

TODO:

  • Określenie koncepcji testu
  • Przygotowanie odpowiedniego zbioru danych
  • Napisanie skryptu do przeprowadzania benchmarków
  • Integracja skryptu z bazą danych

Powiązane taski/bugi

#56

@Kleczyk Kleczyk added this to the v0.1 milestone Dec 1, 2023
@TheJimmyNowak TheJimmyNowak removed this from the v0.1 milestone Dec 4, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants