Prime Intellect dévoile un aperçu de la pile d'inférence pour améliorer les protocoles d'IA

Binance News · 2025-04-29T01:53:54.000Z

According to Foresight News, decentralized AI protocol Prime Intellect has released a preview of its inference stack. This development aims to address challenges in autoregressive decoding, including computational efficiency, KV cache memory bottlenecks, and public network latency. The inference stack employs a pipeline parallel design, enabling high computational density and asynchronous execution. Alongside this release, Prime Intellect has introduced three open-source code libraries: PRIME-IROH, a peer-to-peer communication backend; PRIME-VLLM, which integrates vLLM with public network pipeline parallelism; and PRIME-PIPELINE, a research sandbox. These tools allow users to run large models using GPUs such as the 3090 and 4090, enhancing the capabilities of AI protocols.

Binance News

--・Compte Binance officiel vérifié

Résumé par l’IA

La pile d'inférence de Prime Intellect s'attaque aux défis du décodage autorégressif, offrant aux protocoles d'IA une efficacité de calcul améliorée et une latence réduite grâce au parallélisme des pipelines et aux bibliothèques de code open source.

Selon Foresight News, le protocole d'IA décentralisé Prime Intellect a publié un aperçu de sa pile d'inférence. Ce développement vise à relever des défis dans le décodage autoregressif, y compris l'efficacité computationnelle, les goulets d'étranglement de la mémoire cache KV et la latence des réseaux publics.
La pile d'inférence utilise un design de pipeline parallèle, permettant une haute densité de calcul et une exécution asynchrone. Avec cette version, Prime Intellect a introduit trois bibliothèques de code open-source : PRIME-IROH, un backend de communication pair à pair ; PRIME-VLLM, qui intègre vLLM avec le parallélisme de pipeline sur réseau public ; et PRIME-PIPELINE, un environnement de recherche.
Ces outils permettent aux utilisateurs d'exécuter de grands modèles utilisant des GPU tels que les 3090 et 4090, améliorant ainsi les capacités des protocoles d'IA.

Avertissement : comprend des opinions de tiers. Il ne s’agit pas d’un conseil financier. Peut inclure du contenu sponsorisé. Consultez les CG.

Actualités associées

La chaîne BNB lance un protocole de contexte de modèle pour l'intégration de l'IA

La SEC annonce l'ordre du jour de la quatrième table ronde sur la cryptographie

Musk Annonce la Mise à Jour de l'Algorithme sur la Plateforme X

Vitalik Buterin propose une simplification du protocole Ethereum pour une efficacité accrue

Prime Intellect dévoile un aperçu de la pile d'inférence pour améliorer les protocoles d'IA

Dernières actualités