MicroLM2-1M

Modelo de linguagem leve (~1M parâmetros) treinado em 4.5B tokens.

10 200
0.1 1.5
0.5 1