Rllama
Memperkasakan LLM dengan Pembelajaran Penguatkuasaan Memory-Augmented
Pilihan
5 Undi



Penerangan
Rangka kerja pembelajaran pengukuhan yang diperolehi yang mengajar LLM untuk belajar dan ingat seperti manusia.Mempunyai memori episod, memori kerja, dan enam algoritma RL, ia adalah pisau tentera Swiss anda untuk latihan model bahasa yang lebih bijak.