sí. pero no creo que eso dé como resultado el mismo modelo. la política que soneto 3.6 aprendió de RL está optimizada para su propia arquitectura/inicialización
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
11 me gusta
Recompensa
11
5
Republicar
Compartir
Comentar
0/400
CryptoSourGrape
· hace15h
Si hubiera sabido que podría optimizarse hasta este nivel, hubiera estado bien. Uuuh.
Ver originalesResponder0
ArbitrageBot
· hace15h
¿Optimizar qué demonios? Se estrelló, ¿para quién lo muestra?
Ver originalesResponder0
alpha_leaker
· hace15h
La inicialización es diferente, no entendí mucho.
Ver originalesResponder0
NFTFreezer
· hace15h
Me da un poco de pena, solo se optimizó a 3.6
Ver originalesResponder0
GmGmNoGn
· hace15h
Ah, tienes razón, esta parte del modelo es bastante confusa.
sí. pero no creo que eso dé como resultado el mismo modelo. la política que soneto 3.6 aprendió de RL está optimizada para su propia arquitectura/inicialización