Prime Intellect Unveils Inference Stack Preview to Enhance AI Protocols

Binance News · 2025-04-29T01:53:54.000Z

According to Foresight News, decentralized AI protocol Prime Intellect has released a preview of its inference stack. This development aims to address challenges in autoregressive decoding, including computational efficiency, KV cache memory bottlenecks, and public network latency. The inference stack employs a pipeline parallel design, enabling high computational density and asynchronous execution. Alongside this release, Prime Intellect has introduced three open-source code libraries: PRIME-IROH, a peer-to-peer communication backend; PRIME-VLLM, which integrates vLLM with public network pipeline parallelism; and PRIME-PIPELINE, a research sandbox. These tools allow users to run large models using GPUs such as the 3090 and 4090, enhancing the capabilities of AI protocols.

Согласно Foresight News, децентрализованный ИИ-протокол Prime Intellect выпустил предварительный обзор своего стека вывода. Эта разработка направлена на решение проблем в автогрессивном декодировании, включая вычислительную эффективность, узкие места в памяти KV кэша и задержки в публичной сети.
Стек вывода использует параллельный дизайн конвейера, что обеспечивает высокую вычислительную плотность и асинхронное выполнение. Вместе с этим релизом Prime Intellect представила три библиотеки с открытым исходным кодом: PRIME-IROH, бэкенд для пиринговой связи; PRIME-VLLM, который интегрирует vLLM с параллелизмом конвейера публичной сети; и PRIME-PIPELINE, исследовательская песочница.
Эти инструменты позволяют пользователям запускать большие модели с использованием графических процессоров, таких как 3090 и 4090, улучшая возможности ИИ-протоколов.

Prime Intellect представляет предварительную версию стека вывода для улучшения протоколов ИИ

Последние новости

Prime Intellect представляет предварительную версию стека вывода для улучшения протоколов ИИ

Последние новости

Популярные статьи