(Nova Publicação) Tokens de Risco: Segurança Econômica na Segurança de IA

Há muita pesquisa interessante atualmente em torno da compreensão dos internos dos modelos, bem como em outras áreas de alinhamento + segurança.

Com parte do nosso trabalho @CompoundVC @Compoundarxiv em biosegurança, assim como em cripto, apresento a ideia dos Tokens de Risco, que visam mostrar que quando você alinha incentivos econômicos com comportamentos desejados, a segurança se torna uma propriedade emergente em vez de uma restrição imposta.

Muito disso é inspirado em alguns dos trabalhos recentes na @AnthropicAI sobre rastreamento de circuitos e mais.