Senario Langwatch - Simulasi Ejen
Ujian agentik untuk codebase agentik
Pilihan
104 Undi
Trending
234 Tontonan







Penerangan
Apabila agen AI tumbuh lebih kompleks, penalaran, menggunakan alat, dan membuat keputusan, eval tradisional jatuh pendek.Senario Langwatch mensimulasikan interaksi dunia nyata untuk menguji tingkah laku ejen.Ia seperti ujian unit, tetapi untuk ejen AI.