Suomen kielen osaaminen
#7
by
ArttuPakarinen - opened
Osaa suomen kieltä ihan hyvin, suurimmaksi osaksi.000
Mutta!
Tyypillisiä AI vastauksia jota tämä tuottaa:
- Minä olen täällä auttamaan. "I'm here to help.."
- Mitä sinä kuuluu? "How are you doing?"
Onko nää jo treenausvaiheessa tulleita käännöskukkasia? Tuntuu juuri näitä, erityisesti 1. toistavan niin useasti.
Jos katsot tän modellin datasetin readmetä niin siinä ne mainitsi että ne käänsi suurimman osan datasta Llama 3.3 70B ja Poro 34B modelleilla englannista suomeksi.
LumiOpen/poro2-instruction-collection
# Finnish data
For the Finnish portion, we translated prompts from the Tulu3 SFT Mixture into Finnish. We used Llama-3.3-70B-Instruct to generate multiple responses to the translated prompts and used the same model to select the best response.
We supplemented this data with the top Finnish conversations from Open Assistant 2 and Avoin Avustaja.
### Prompt selection
We deduplicated the prompts in the Tulu3 dataset, excluded prompts that have a non-commercial license, and excluded prompts that are not in English.
### Prompt translation
We translated the prompts with Poro-34B using few-shot prompting. Following our previous work, we experimented with different prompt formats and number of examples.