GRAMO.

Hyperfast LLM ejecutándose en GPU personalizadas

Destacado

213 Votos

Visitar el sitio web

Descripción

Un motor de inferencia de LPU, con LPU que representa la Unidad de procesamiento del lenguaje ™, es un nuevo tipo de sistema de unidad de procesamiento de extremo a extremo que proporciona la inferencia más rápida a ~ 500 tokens/segundo.

Categorías

Modelos de Lenguaje Editores de Código

Etiquetas

Hardware Inteligencia artificial Técnica

Descripción

Categorías

Etiquetas

Productos recomendados