Рлама
Расширение прав и возможностей LLM с учетом подкрепления с атмосферой памяти
Показан
5 Голоса



Описание
Основанная на память о подкреплении структуры обучения, которая учит LLMS учиться и помнить, как люди.Показывая эпизодическую память, рабочую память и шесть алгоритмов RL, это ваш швейцарский армейский нож для обучения более умных языковых моделях.