2025-08-15 04:35:00

sí. pero no creo que eso dé como resultado el mismo modelo. la política que soneto 3.6 aprendió de RL está optimizada para su propia arquitectura/inicialización

DON-8.59%

THINK-2.1%

IN-9.16%

OWN-0.75%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

11 me gusta

Recompensa
11
5
Republicar
Compartir

Comentar

0/400

CryptoSourGrape

· hace15h

Si hubiera sabido que podría optimizarse hasta este nivel, hubiera estado bien. Uuuh.

Ver originalesResponder0

ArbitrageBot

· hace15h

¿Optimizar qué demonios? Se estrelló, ¿para quién lo muestra?

Ver originalesResponder0

alpha_leaker

· hace15h

La inicialización es diferente, no entendí mucho.

Ver originalesResponder0

NFTFreezer

· hace15h

Me da un poco de pena, solo se optimizó a 3.6

Ver originalesResponder0

GmGmNoGn

· hace15h

Ah, tienes razón, esta parte del modelo es bastante confusa.

Ver originalesResponder0

Tema
#July PPI Beats Expectations
13k Popularidad
#ETH ETFs Top $30B
13k Popularidad
#Gate Alpha Peak Trading Competition
138k Popularidad
#Gate Releases August Reserves Report
20k Popularidad
#BTC Hits New ATH
89k Popularidad

Anclado