Qwen
/

Qwen2-1.5B

Text Generation

text-generation-inference

Model card Files Files and versions

Resources

View closed (1)

Number of Pretraining Tokens per Qwen 2.5 Model?

#9 opened 4 months ago by

evaluation pipeline

#8 opened 11 months ago by

Hello, is this 1.5B model trained from scratch, or is it distilled like LLaMA 3.2?

#7 opened about 1 year ago by

recommended context length for SFT?

#6 opened over 1 year ago by

Why is there no model.safetensors.index.json file?

#5 opened over 1 year ago by

[AUTOMATED] Model Memory Requirements

#3 opened over 1 year ago by

model-sizer-bot

lm_eval results is weird

#2 opened over 1 year ago by

Upload ONNX weights

#1 opened over 1 year ago by