プレフェース補強微調整

LLM出力を改善するためのLLM補強微調整プラットフォーム

注目

140 投票

ウェブサイトを訪問

説明

Predibaseは、補強学習を使用してLLMをカスタマイズするための画期的なアプローチを約束し、最初の強化微調整プラットフォームをリリースしました。RFTを使用して、ラベル付きデータが制限されている場合でも、GPT-4を上回るオープンソースLLMをトレーニングします。

カテゴリ

大規模言語モデルマーケットプレイスサイト

タグ

saas 開発者ツール人工知能

推奨製品