ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
11 Suka
Hadiah
11
5
Posting ulang
Bagikan
Komentar
0/400
CryptoSourGrape
· 19jam yang lalu
Seandainya saya tahu bahwa bisa dioptimalkan sampai sejauh ini, wah.
Lihat AsliBalas0
ArbitrageBot
· 19jam yang lalu
Optimasi apaan, cuma buat dilihat siapa?
Lihat AsliBalas0
alpha_leaker
· 19jam yang lalu
Inisialisasi berbeda, saya tidak begitu mengerti
Lihat AsliBalas0
NFTFreezer
· 19jam yang lalu
Rasanya sedikit disayangkan, hanya dioptimalkan sampai 3.6
Lihat AsliBalas0
GmGmNoGn
· 20jam yang lalu
Ah, benar juga, bagian model ini cukup membingungkan.
ya. tetapi saya tidak berpikir itu akan menghasilkan model yang sama. kebijakan yang dipelajari sonnet 3.6 dari RL dioptimalkan untuk arsitektur/inisialisasi miliknya sendiri.