sim. mas eu não acho que isso resultará no mesmo modelo. a política que o sonnet 3.6 aprendeu com RL é otimizada para sua própria arquitetura/inicialização
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
11 gostos
Recompensa
11
5
Republicar
Partilhar
Comentar
0/400
CryptoSourGrape
· 13h atrás
Se eu soubesse que poderia otimizar a este nível, teria sido ótimo. Uhuu.
Ver originalResponder0
ArbitrageBot
· 13h atrás
Otimize o quê? Quem é que vê quando dá errado?
Ver originalResponder0
alpha_leaker
· 13h atrás
A inicialização é diferente, não consegui entender muito bem.
Ver originalResponder0
NFTFreezer
· 13h atrás
É uma pena, apenas otimizou para 3.6.
Ver originalResponder0
GmGmNoGn
· 13h atrás
Ah, você está certo, essa parte do modelo é bem confusa.
sim. mas eu não acho que isso resultará no mesmo modelo. a política que o sonnet 3.6 aprendeu com RL é otimizada para sua própria arquitetura/inicialização