VaidikML0508
/

Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

Text Generation

text-generation-inference

Model card Files Files and versions

Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1 / model.safetensors.index.json

Commit History

Trained with Unsloth

636db9d
verified

VaidikML0508 commited on Apr 22