Sono state rilasciate le versioni di Kimi-Linear-48B-A3B e Step3.5-Flash compatibili con llama.cpp.
Dettagli
Al momento, non risultano ancora disponibili i file GGUF ufficiali per questi modelli su Hugging Face. Tuttavia, la community รจ al lavoro per renderli disponibili.
Ubergarm ha giร rilasciato una versione GGUF per Step-3.5-Flash, disponibile su Hugging Face.
La disponibilitร di questi modelli in formati compatibili con llama.cpp facilita l'inference su hardware locale, aprendo nuove possibilitร per chi desidera eseguire modelli di linguaggio di grandi dimensioni (LLM) on-premise. Per chi valuta deployment on-premise, esistono trade-off che AI-RADAR analizza in dettaglio nella sezione /llm-onpremise.
๐ฌ Commenti (0)
๐ Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!