llm

PhilipMay · Dec 29, 2023 · b8f53ae · b8f53ae
1 parent 6114607
commit b8f53ae
Showing 1 changed file with 9 additions and 0 deletions.
diff --git a/source/machine-learning/llm.md b/source/machine-learning/llm.md
@@ -1,7 +1,16 @@
 # LLM
 
 ## Base Knowledge
+
 - Direct Preference Optimization (DPO)
   - Paper: <https://arxiv.org/abs/2305.18290>
   - <https://plainenglish.io/community/direct-preference-optimization-dpo-a-simplified-approach-to-fine-tuning-large-language-models>
   - <https://huggingface.co/blog/dpo-trl>
+
+## Specific Models
+
+- Argilla Notux
+  - based on Mixtral
+  - HF Model: <https://huggingface.co/argilla/notux-8x7b-v1>
+  - Dataset: <https://huggingface.co/datasets/argilla/ultrafeedback-binarized-preferences-cleaned>
+  - Code: <https://github.com/argilla-io/notus>