Metin
/

LLaMA-3-8B-Math-Majority-Vote-GRPO

Text Generation

text-generation-inference

test-time-reinforcement-learning

Model card Files Files and versions

LLaMA-3-8B-Math-Majority-Vote-GRPO

17.3 MB

Ctrl+K

Ctrl+K

2 contributors

History: 3 commits

Metin's picture

Upload tokenizer

52635a2 verified 11 months ago