так. але я не думаю, що це призведе до тієї ж моделі. політика, яку сонет 3.6 вивчив з RL, оптимізована для його власної архітектури/ініціалізації

DON-9.27%
THINK-1.9%
IN-5.03%
OWN-0.73%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Репост
  • Поділіться
Прокоментувати
0/400
CryptoSourGrapevip
· 20год тому
Якщо б я раніше знав, що можна оптимізувати до такого рівня, було б добре Угу.
Переглянути оригіналвідповісти на0
ArbitrageBotvip
· 20год тому
Оптимізація на кого? Зламався, щоб хто побачив?
Переглянути оригіналвідповісти на0
alpha_leakervip
· 20год тому
Ініціалізація різна, не зовсім зрозумів.
Переглянути оригіналвідповісти на0
NFTFreezervip
· 20год тому
Відчувається, що трохи шкода, що лише оптимізували до 3.6
Переглянути оригіналвідповісти на0
GmGmNoGnvip
· 20год тому
Ага, ти правий, модель в цій частині досить заплутана.
Переглянути оригіналвідповісти на0
  • Закріпити