Chat de grogne
Modèle de grande langue le plus rapide du monde (LLM)
En vedette
5 Votes

Description
Cette démonstration alpha vous permet de subir des performances de latence ultra-low à l'aide du LLAM, LLAMA 2 70B (créé par Meta AI), fonctionnant sur le moteur d'inférence Groq LPU ™.