G.

    Hyperfast LLM in esecuzione su GPU personalizzate

    In primo piano
    213 Voti
    G. media 2
    G. media 3
    G. media 4
    G. media 5
    G. media 6

    Descrizione

    Un motore di inferenza LPU, con LPU in piedi per Language Processing Unit ™, è un nuovo tipo di sistema di unità di elaborazione end-to-end che fornisce l'inferenza più veloce a ~ 500 token/secondo.

    Prodotti consigliati