Tôi đã nghĩ về nhược điểm của OpenLedger một thời gian và ban đầu cảm giác khá quen thuộc.
Một dự án blockchain nói về dữ liệu, AI và việc trả thưởng cho những người đóng góp dữ liệu. Nghe thì ổn, thậm chí còn khá hợp lý trong bối cảnh AI đang phát triển rất nhanh và ngày càng cần nhiều dữ liệu chất lượng hơn.
Nhưng rồi tôi tự hỏi một câu đơn giản hơn.
Nếu mọi thứ nghe hợp lý đến vậy tại sao mô hình này vẫn chưa xuất hiện ở quy mô lớn?
Ý tôi là vấn đề dữ liệu cho AI không phải mới xuất hiện hôm qua mà nó đã tồn tại nhiều năm. Các công ty AI luôn cần dữ liệu, người dùng luôn tạo ra dữ liệu và ai cũng biết rằng dữ liệu là nguồn tài nguyên có giá trị. Vậy điều gì đã khiến thị trường chưa tự giải quyết được bài toán này từ trước?
Và đó là lúc tôi bắt đầu nhìn vào những giới hạn của OpenLedger thay vì chỉ nhìn vào những gì họ hứa hẹn.
Concept cốt lõi của OpenLedger khá dễ hiểu. Họ muốn biến dữ liệu thành một loại tài sản có thể được ghi nhận, theo dõi nguồn gốc và được trả thưởng khi AI sử dụng nó. Thay vì dữ liệu bị hút về các công ty tập trung thì người tạo dữ liệu sẽ nhận được một phần giá trị.
Nghe rất hấp dẫn.
Nhưng chưa chắc.
Vấn đề nằm ở chỗ dữ liệu không giống Bitcoin, không giống token và cũng không giống tài sản tài chính thông thường.
Giá trị của dữ liệu rất khó đo lường.
Một bức ảnh có giá trị bao nhiêu? Một đoạn hội thoại có giá trị bao nhiêu? Một bài viết được dùng để huấn luyện AI thì đóng góp bao nhiêu phần trăm vào chất lượng cuối cùng của mô hình?
Nói thật thì tôi chưa thấy ai có câu trả lời hoàn hảo cho những câu hỏi đó.
Và nếu không thể đo lường chính xác giá trị của dữ liệu thì việc phân phối phần thưởng cũng sẽ trở nên tương đối. Điều đó có nghĩa là cuối cùng vẫn sẽ cần một cơ chế nào đó để định nghĩa dữ liệu nào tốt hơn dữ liệu nào.
Và rồi câu hỏi xuất hiện.
Ai là người định nghĩa?
Là thuật toán?
Là đội ngũ dự án?
Là cộng đồng?
Hay là chính các công ty AI mua dữ liệu?
Nghe có vẻ khác nhau nhưng thực tế mỗi lựa chọn đều tạo ra một trung tâm quyền lực mới.
Đây là phần mà tôi thấy thú vị nhất.
Blockchain thường được nói đến như một công cụ phi tập trung hóa niềm tin nhưng dữ liệu và AI lại là hai lĩnh vực mà chất lượng luôn phải được đánh giá bởi một tiêu chuẩn nào đó. Mà đã có tiêu chuẩn thì sẽ có người thiết kế tiêu chuẩn.
Vì vậy đôi khi tôi cảm thấy OpenLedger không thực sự loại bỏ quyền lực. Nó chỉ đang cố gắng phân phối lại quyền lực sang một cấu trúc khác.
Điều đó không hẳn là xấu.
Nhưng nó đáng để suy nghĩ.
Một điểm khác mà tôi thấy khá khó là vấn đề chất lượng dữ liệu.
Nếu một hệ thống bắt đầu trả thưởng cho dữ liệu thì động lực kinh tế sẽ xuất hiện và khi có động lực kinh tế, con người sẽ tìm cách tối ưu hóa phần thưởng.
Điều này gần như là quy luật.
Người ta có thể tạo dữ liệu hàng loạt, người ta có thể spam , Người ta có thể xây dựng cả một ngành công nghiệp sản xuất dữ liệu chỉ để nhận token.
Nghe có vẻ cực đoan.
Nhưng lịch sử crypto đã cho thấy điều đó xảy ra rất nhiều lần.
Từ liquidity mining, airdrop farming cho tới các mô hình incentive khác.
Vì vậy bài toán của OpenLedger không chỉ là thu hút dữ liệu.
Bài toán thật sự là chống lại dữ liệu giả nhưng vẫn giữ được tính mở của mạng lưới.
Đó là một cân bằng rất khó.
Nhưng nếu nghĩ kỹ hơn, còn một lớp vấn đề khác.
OpenLedger cần dữ liệu để thu hút các công ty AI. Nhưng các công ty AI chỉ thực sự quan tâm khi mạng lưới đã có đủ dữ liệu chất lượng.
Nghe hơi giống một vòng lặp.
Muốn có người mua thì phải có người bán.
Muốn có người bán thì phải có người mua.
Vì vậy giai đoạn đầu gần như chắc chắn sẽ phải dựa vào incentive để kích hoạt mạng lưới.
Điều đó không có gì bất thường.
Nhưng tôi vẫn tự hỏi phần thưởng ban đầu đến từ đâu. Từ nhu cầu thực của thị trường dữ liệu hay từ kỳ vọng rằng nhu cầu đó sẽ xuất hiện trong tương lai?
Hai thứ này nhìn bên ngoài có thể khá giống nhau.
Nhưng bản chất lại rất khác.
Và rồi còn một lớp sâu hơn nữa.
AI không chỉ cần dữ liệu.
AI cần dữ liệu có ngữ cảnh, có tính cập nhật và phù hợp với từng tác vụ cụ thể.
Điều đó có nghĩa là số lượng dữ liệu chưa chắc đã quan trọng bằng chất lượng và khả năng tổ chức dữ liệu.
Nếu vậy giá trị có thể không nằm ở người tạo dữ liệu mà nằm ở người phân loại, người xác thực hoặc người xây dựng hệ thống đánh giá.
Một lần nữa quyền lực lại dịch chuyển.
Không biến mất.
Chỉ dịch chuyển.
Và rồi tôi bắt đầu nghĩ tới một câu hỏi khác.
Giả sử OpenLedger hoạt động đúng như thiết kế.
Giả sử dữ liệu được thu thập hiệu quả.
Giả sử người đóng góp được trả thưởng công bằng.
Liệu điều đó có đồng nghĩa phần lớn giá trị sẽ thuộc về người tạo dữ liệu?
Tôi không chắc.
Bởi trong ngành AI dữ liệu chỉ là một phần của chuỗi giá trị.
Người sở hữu mô hình thường có nhiều quyền lực hơn.
Người sở hữu sản phẩm tiếp cận người dùng thường có nhiều quyền lực hơn nữa.
Điều đó có nghĩa là ngay cả khi quyền sở hữu dữ liệu được phân phối rộng hơn, phần lớn giá trị kinh tế cuối cùng vẫn có thể tiếp tục tích tụ ở những tầng phía trên.
Nói cách khác, sự mất cân bằng có thể thay đổi hình dạng.
Nhưng chưa chắc biến mất.
Một điểm khác khiến tôi phân vân là dữ liệu không giống những tài sản kỹ thuật số thông thường.
Bitcoin ngày hôm nay vẫn là Bitcoin ngày mai.
Nhưng dữ liệu thì không.
Dữ liệu có tuổi thọ.
Một hành vi người dùng năm ngoái có thể không còn phản ánh hiện tại. Một tập dữ liệu từng rất hữu ích có thể nhanh chóng mất giá trị khi thế giới thay đổi.
Điều đó khiến OpenLedger không chỉ cần thu hút dữ liệu.
Họ cần liên tục duy trì dòng dữ liệu mới.
Và đây là áp lực tồn tại vĩnh viễn chứ không phải bài toán chỉ giải quyết một lần.
Và rồi còn một nghịch lý khác.
Khi AI ngày càng phát triển và internet sẽ chứa ngày càng nhiều nội dung do AI tạo ra.
Điều đó có nghĩa là trong tương lai, một phần dữ liệu được đưa vào mạng lưới có thể không còn là dữ liệu gốc từ con người nữa.
Nếu điều đó xảy ra ở quy mô lớn và câu hỏi sẽ không còn là làm sao thu hút nhiều dữ liệu hơn.
Mà là làm sao biết dữ liệu nào thực sự đáng tin cậy.
Ai là người xác minh nguồn gốc?
Ai là người đánh giá chất lượng?
Ai là người quyết định đâu là tín hiệu và đâu chỉ là nhiễu?
Có vẻ như càng đi sâu vào bài toán dữ liệu thì tôi càng thấy đây thực chất là bài toán niềm tin được ngụy trang dưới dạng bài toán công nghệ.
Điều đó đưa tôi đến một suy nghĩ rộng hơn về OpenLedger và cả xu hướng AI x blockchain nói chung.
Chúng ta thường nói về việc phi tập trung hóa dữ liệu như thể đó là một mục tiêu hiển nhiên đúng đắn. Nhưng công nghệ không trung lập mà nó luôn mang theo những giả định về cách con người hợp tác với nhau.
OpenLedger đang giả định rằng nếu tạo đủ động lực kinh tế, thị trường sẽ tự tổ chức để cung cấp dữ liệu chất lượng cho AI.
Có thể đúng.
Nhưng cũng có thể thị trường chỉ tối ưu hóa cho phần thưởng ngắn hạn thay vì chất lượng dài hạn.
Có thể dữ liệu sẽ được dân chủ hóa.
Nhưng cũng có thể quyền lực chỉ dịch chuyển sang những người kiểm soát cơ chế đánh giá dữ liệu.
Có thể người dùng sẽ được trao nhiều quyền hơn.
Nhưng cũng có thể phần lớn giá trị cuối cùng vẫn thuộc về những thực thể sở hữu mô hình AI mạnh nhất.
Đó là điều mà tôi chưa chắc chắn.
Và có lẽ đây mới là bài test thật sự của OpenLedger. Không phải tốc độ blockchain, không phải tokenomics hay số lượng người dùng mà là liệu họ có thể xây dựng được một hệ thống nơi động lực kinh tế, chất lượng dữ liệu, quyền lực ra quyết định và nhu cầu thực của thị trường không phá vỡ lẫn nhau hay không.
Còn lại, tôi nghĩ vấn đề thật sự không nằm ở việc dữ liệu có được đưa lên blockchain hay không.
Nó nằm ở chỗ cuối cùng ai là người được quyền nói rằng dữ liệu nào có giá trị.
Bởi trong nền kinh tế AI, quyền lực có lẽ không thuộc về người sở hữu dữ liệu.
Mà thuộc về người định nghĩa giá trị của dữ liệu đó.
Và đây mới là bài kiểm tra khó nhất đối với bất kỳ mạng lưới dữ liệu phi tập trung nào.
@OpenLedger #Openledger $OPEN