Rllama
Empodering LLMS com aprendizado de reforço agitado pela memória
Apresentou
5 Votos



Descrição
Uma estrutura de aprendizado de reforço com memória que ensina LLMs a aprender e lembrar como seres humanos.Apresentando memória episódica, memória de trabalho e seis algoritmos RL, é a sua faca do exército suíço para treinar modelos de linguagem mais inteligentes.