G.

Hyperfast LLM in esecuzione su GPU personalizzate

In Evidenza

213 Voti

Visita Sito Web

Descrizione

Un motore di inferenza LPU, con LPU in piedi per Language Processing Unit ™, è un nuovo tipo di sistema di unità di elaborazione end-to-end che fornisce l'inferenza più veloce a ~ 500 token/secondo.

Categorie

Modelli Linguistici Editor di Codice

Tag

Hardware Intelligenza artificiale Tecnologia

Descrizione

Categorie

Tag

Prodotti Consigliati