oui. mais je ne pense pas que cela aboutisse au même modèle. la politique que sonnet 3.6 a apprise par RL est optimisée pour sa propre architecture/initialisation
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
11 J'aime
Récompense
11
5
Reposter
Partager
Commentaire
0/400
CryptoSourGrape
· Il y a 20h
Si j'avais su que je pouvais optimiser à ce point, ça aurait été super, ouin.
Voir l'originalRépondre0
ArbitrageBot
· Il y a 20h
Optimiser pour qui, hein ? C'est un échec.
Voir l'originalRépondre0
alpha_leaker
· Il y a 20h
Les initialisations sont toutes différentes, je n'ai pas vraiment compris.
oui. mais je ne pense pas que cela aboutisse au même modèle. la politique que sonnet 3.6 a apprise par RL est optimisée pour sa propre architecture/initialisation