(huggingface.co)

365 points kashifr | 1 comments | 08 Jul 25 16:13 UTC | HN request time: 0.544s | source

1. gdiamos ◴[08 Jul 25 17:49 UTC] No.44502342[source]▶

Nice work anton et al.

I hope you continue the 50-100M parameter models.

I think there is a case for models that finish fast on CPUs in solve by llm test cases.

Smollm3: Smol, multilingual, long-context reasoner LLM