rllama
เพิ่มขีดความสามารถ LLM ด้วยการเรียนรู้การเสริมแรงแบบหน่วยความจำ
เด่น
5 โหวต



คำอธิบาย
กรอบการเรียนรู้การเสริมแรงแบบเสริมความทรงจำที่สอน LLM ให้เรียนรู้และจดจำเหมือนมนุษย์นำเสนอความทรงจำตอนฉากความทรงจำที่ทำงานและอัลกอริทึม RL หกอัลกอริทึมมันเป็นมีดกองทัพสวิสของคุณสำหรับการฝึกอบรมแบบจำลองภาษาที่ชาญฉลาด