Sahara está a punto de TGE, la valoración previa a la emisió

Sahara está a punto de TGE, la valoración previa a la emisión supera los 1,000 millones de dólares, la popularidad del sector de activos de datos × AI está aumentando rápidamente.

Al mismo tiempo, varios proyectos de AI también están en fila para emitir tokens, todo el sector entra en una nueva ronda de precalentamiento.

Una plataforma de etiquetado de datos más fundamental, pero de la que rara vez se habla, Codatta @codatta_io, se espera que también esté a punto de TGE.

Aún no ha emitido tokens, solo ha obtenido 2.5 millones de dólares en financiación de ronda semilla de OKX. Anteriormente, la tarea de este proyecto la probé de la misma manera que Sahara.

Antes, algunas personas al realizar tareas la consideraron como un “proyecto de referencia” para Sahara, pero en mi opinión, en realidad está abordando una dimensión completamente diferente:

Si Sahara es una “plataforma de transacción de datos”, entonces Codatta es más bien una “fábrica de producción de activos de datos”. Uno resuelve problemas de circulación, el otro se centra en la producción de activos, ambos tienen división de trabajo y también pueden ser complementarios.

En la actualidad, la evaluación de modelos de AI se parece cada vez más a un “espectáculo de rankings”, recientemente muchos amigos están obsesionados con el ranking de Chatbot Arena, Claude, GPT-4o, Gemini compitiendo una y otra vez, incluso hay personas que crean grupos para apostar sobre quién ganará. Pero, ¿realmente se han preguntado: este ranking, realmente se puede confiar?

La respuesta es: cada vez menos.

Porque hay organizadores que han revelado que se puede ajustar el modelo según las preferencias de los usuarios, e incluso el mecanismo de evaluación anónima podría estar contaminado por votantes falsos. Crees que estás participando en la evaluación del modelo, pero en realidad solo estás viendo una actuación ensayada.

Y en medio de este caos, Codatta lanzó Arena, al escuchar el nombre podrías pensar que es “otro ranking”, pero lo que están haciendo en realidad es reconstruir la base de confianza en la evaluación, cada pregunta es iniciada por los usuarios, el modelo responde de forma ciega, la comunidad vota con nombre real para evaluar, los datos de votación, el contenido de las respuestas, la lógica de puntuación, todo está escrito en la subred de Avalanche Kite, con evidencia en la cadena, nadie puede modificarlo. Es decir, no importa si eres OpenAI o un “modelo de imitación del vecino”, aquí se viene sin respaldo.

Entrada a Codatta Arena: https://t.co/T0UmZiyVaF

Este Arena es un enfoque clave para Codatta, pero solo es una parte del proyecto. La mayor ambición de Codatta es establecer un nuevo enfoque sobre “datos”.

En el pasado, los datos de entrenamiento utilizados para desarrollar grandes modelos eran todos obtenidos de forma gratuita, ya sea de corpus de código abierto o el botón “acepto” que tú y yo hemos clicado, nunca preguntan si estás de acuerdo o si deseas una parte de los beneficios. Y el mecanismo que propone Codatta es: tú propones preguntas, tú votas, tú revisas, estas ya no son tareas en vano, sino un activo de datos que puede ser reconocido, rastreado y participar en la distribución de beneficios.

Cada vez que realizas una etiquetación efectiva, cada vez que participas en una evaluación, podrás obtener puntos. Cuando los tokens se lancen (TGE), esos puntos se convertirán en airdrop. Esta es la lógica de incentivos que Web3 debería tener: los datos no vienen de la nada, detrás de ellos está el trabajo humano, el juicio humano.

Así que, en este sentido, Arena no es solo una “función de evaluación”, es una demostración de esta lógica de derechos de datos: cada interacción que tenemos con el modelo se convierte en un proceso de producción de datos y acumulación de activos. Así como Arweave convierte el almacenamiento en un activo, Render convierte la potencia de cálculo en un activo, Codatta convierte las acciones de datos en activos.

Además de la tecnología, Codatta recientemente ha añadido dos socios ecológicos en sus colaboraciones externas: @SaharaLabsAI y @irys_xyz, uno es el practicante más radical en el campo de la computación en privacidad, el otro es un protocolo líder centrado en incentivos de almacenamiento en cadena. El primero garantiza que los datos de los usuarios no se filtren durante la participación en la evaluación, el segundo asegura la permanencia y archivo distribuido de los datos en cadena. Con el respaldo de ambos, la capacidad de “reconocimiento de datos en cadena + incentivos de etiquetado” de Codatta puede conectarse en el futuro a escenarios más profundos nativos de AI, como evaluaciones en ámbitos privados de empresas, sistemas de evaluación para industrias sensibles.

¿Y ahora qué?

Desde el punto de vista de los datos, ya ha acumulado más de 300,000 usuarios y 2 millones de datos verificados. Aunque aún no ha emitido tokens, toda la lógica ya está definida: el sistema de puntos está en funcionamiento, el mecanismo de staking es utilizable, el comportamiento de los usuarios puede mapearse como participaciones en tokens. No es un proyecto de PPT, tampoco un soñador cibernético, sino un producto protocolar que avanza paso a paso con un camino visible.

A menudo decimos que la misión de Web3 es “convertir el comportamiento del usuario en activos”, pero la mayoría de los proyectos terminan convirtiendo este “activo” en una “oportunidad de obtener beneficios”. Codatta no es así. Su camino no está destinado a ser tan bullicioso, si preguntas si será un gigante en el futuro, no lo sé. Pero si preguntas si en este momento es uno de los protocolos de evaluación más originales y verificables de AI + Web3, la respuesta es afirmativa.

Cuando los sistemas de AI se parecen cada vez más a una caja negra, y los resultados de la evaluación son cada vez más manipulados, siempre debe haber un lugar que nos diga:

¿Realmente funciona este modelo? Solo cuenta lo que tú digas.