De acordo com o Foresight News, o protocolo de IA descentralizado Prime Intellect está prestes a disponibilizar seu modelo de aprendizado por reforço distribuído, o INTELLECT-2, como código aberto. Este modelo oferece suporte à pesquisa em treinamento descentralizado e apresenta a estrutura PRIME-RL, a verificação TOPLOC e a distribuição de pesos SHARDCAST para aprimorar a estabilidade do treinamento. Ele se baseia no modelo QwQ-32B, aprimorando o desempenho matemático e de codificação. Os planos futuros incluem o aumento da taxa de computação de inferência, a invocação de ferramentas, o aprendizado por reforço em múltiplas rodadas e a integração de modelos.