legacy-datasets/wikipedia
Updated • 107k • 636
Это языковая модель на 248 миллионов параметров. Модель построена на архитектуре Llama и обучена с нуля на русскоязычном и англоязычном датасете.
Quark — это эксперимент по созданию эффективных и быстрых моделей, которые можно обучать в домашних условиях на "народном" железе.
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "lumasik/quark-1-248m-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
prompt = "В глубоком космосе висел заброшенный корабль,"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_length=100)
print(tokenizer.decode(outputs[0]))