đ¨ INSIGHT: Il test di Alibaba mostra gravi problemi di affidabilitĂ con gli agenti di codifica AI
I ricercatori di Alibaba hanno testato 18 agenti di codifica AI in un esperimento di 233 giorni e hanno scoperto che circa il 75% degli agenti ha compromesso codice precedentemente funzionante durante i compiti di manutenzione. $ADA
Risultati chiave:
⢠đ¤ 18 agenti di codifica AI testati
⢠⹠233 giorni di valutazione $ZEC
⢠â ď¸ ~75% ha introdotto bug durante la modifica del codice esistente $NEAR
⢠𧊠Molti sistemi hanno avuto difficoltà a mantenere grandi basi di codice in evoluzione
Cosa significa:
Sebbene gli strumenti AI stiano diventando potenti per generare codice, l'esperimento suggerisce che la manutenzione software a lungo termine rimane una grande sfida per i sistemi di codifica autonomi.
đ Considerazione dell'industria:
I risultati evidenziano perchĂŠ molte aziende si affidano ancora a sviluppatori umani per rivedere il codice generato dall'AI, specialmente per sistemi di produzione complessi, anche se gli strumenti di codifica AI continuano a migliorare.