LAMBADA evaluation accuracy #39

kayhanbehdin · 2023-08-05T03:46:15Z

Hello, I've been experimenting with GPTQ and trying to replicate your LAMBADA zero-shot results. But I have been getting significantly lower accuracy (10-15% lower for OPT specifically) compared to the paper, even for the FP16 baseline. I'm using your pipeline based on LM evaluation harness. I was wondering if you have seen this before?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

LAMBADA evaluation accuracy #39

LAMBADA evaluation accuracy #39

kayhanbehdin commented Aug 5, 2023

LAMBADA evaluation accuracy #39

LAMBADA evaluation accuracy #39

Comments

kayhanbehdin commented Aug 5, 2023