VaidikML0508
/

Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

Text Generation

text-generation-inference

Model card Files Files and versions

Shark-Tank-Offer-Evaluator-llama3.2-3B-Instruct-GRPO-16bits-V1

Commit History

Update README.md

35cf07b
verified

VaidikML0508 commited on Apr 22

Trained with Unsloth

6cb13c9
verified

VaidikML0508 commited on Apr 22

Trained with Unsloth

636db9d
verified

VaidikML0508 commited on Apr 22

Upload tokenizer

75a4ffa
verified

VaidikML0508 commited on Apr 22

Upload README.md with huggingface_hub

44007dc
verified

VaidikML0508 commited on Apr 22

initial commit

edb5b3b
verified

VaidikML0508 commited on Apr 22