waltgrace
/

llama-cpp-expert-sniper

Text Generation

Mixture of Experts

expert-prefetch

Model card Files Files and versions

llama-cpp-expert-sniper

320 kB

Ctrl+K

Ctrl+K

1 contributor

History: 14 commits

waltgrace's picture

Q8 result: thrashes on 16 GB (CPU_REPACK doubles memory)

8270847 verified 6 days ago