GLM ha annunciato il rilascio di un modello OCR (Optical Character Recognition) open source, denominato GLM-OCR, ora disponibile sulla piattaforma Hugging Face.
Dettagli del modello
Secondo le prime indicazioni, GLM-OCR è un modello relativamente leggero, con una stima di 1.4 miliardi di parametri totali. Questa architettura si compone di due elementi principali: un modello di visione da circa 0.9 miliardi di parametri, dedicato all'analisi delle immagini, e un modello linguistico da circa 0.5 miliardi di parametri, incaricato dell'interpretazione del testo estratto.
La dimensione contenuta del modello suggerisce un potenziale per inferenze rapide, rendendolo adatto a scenari in cui la velocità di elaborazione è un fattore critico. Questo potrebbe includere applicazioni come l'estrazione di dati da documenti, l'automazione di processi di lettura e l'integrazione in sistemi embedded con risorse limitate.
Per chi valuta deployment on-premise, esistono trade-off da considerare. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi trade-off.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!