Predibaseは、補強学習を使用してLLMをカスタマイズするための画期的なアプローチを約束し、最初の強化微調整プラットフォームをリリースしました。RFTを使用して、ラベル付きデータが制限されている場合でも、GPT-4を上回るオープンソースLLMをトレーニングします。