Foresight News notícia, Laboratório de IA Distribuída Gradient lança o quadro de reforço distribuído Echo-2, com o objetivo de romper as barreiras de eficiência no treinamento de pesquisa em IA. Este quadro consegue reduzir os custos de pós-treinamento de modelos grandes ao implementar a desacoplamento entre Learner e Actor na camada de arquitetura, visando diminuir o custo de pós-treinamento de modelos de 30B de 4500 dólares para 425 dólares.
O Echo-2 utiliza tecnologia de separação de armazenamento e computação para realizar treinamento assíncrono (Async RL), suportando descarregar o poder de amostragem para instâncias de GPU instáveis e GPUs heterogêneas baseadas em Parallax. Este quadro, aliado a técnicas como staleness bound, agendamento tolerante a falhas de instância e o protocolo de comunicação proprietário Lattica, melhora a eficiência do treinamento mantendo a precisão do modelo.
Além disso, a Gradient planeja lançar a plataforma RLaaS (Reinforcement Learning as a Service) Logits, que já está aberta para agendamento por estudantes e pesquisadores.