ME AI 消息,hexoai开源了SIA(自我改进AI)框架。该框架展示了AI智能体不仅能优化其外部工作流(harness),还能通过任务反馈直接更新自身的模型权重,从而在领域知识和能力上实现自主提升,而非仅依赖人类提供的提示或工具改进。论文报告显示,SIA在LawBench基准上性能提升56.6%,在GPU kernels运行上耗时减少91.9%,在单细胞RNA去噪任务中相比基线提升502%。(来源:ME)
ME AI 消息,Google 推出 Google Pay & Wallet Developer MCP server,这是一款开放标准工具,旨在将 AI 开发助手和 IDE 安全连接到实时的 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态以及管理商户账户。该集成旨在通过减少上下文切换并提供实时、可靠的 AI 支持来减少开发摩擦,从而加速开发工作流。(来源:ME)
Claude Opus 4.8 phát hành: Nâng cấp toàn diện trong mã hóa, kỹ năng tác nhân và suy luận
ME AI tin tức, Anthropic đã phát hành thế hệ mô hình mới Claude Opus 4.8, như một bản nâng cấp của Opus 4.7, đạt được những tiến bộ trong các bài kiểm tra chuẩn về mã hóa, kỹ năng tác nhân, suy luận và kiến thức thực tiễn. Claude Opus 4.8 hiện đã có sẵn, giá cả tương đương với phiên bản trước. Các tính năng mới được phát hành đồng thời bao gồm: người dùng có thể kiểm soát mức độ tham gia vào nhiệm vụ, Claude Code bổ sung tính năng "luồng làm việc động", và chế độ tốc độ 2.5x của Opus 4.8 có giá giảm xuống còn một phần ba so với trước đây. Những người thử nghiệm sớm đã phản hồi rằng khả năng phán đoán trong các nhiệm vụ của tác nhân trở nên đáng tin cậy hơn, việc gọi công cụ hiệu quả hơn. Mô hình này đạt 84% trong bài kiểm tra Online-Mind2Web, vượt qua Opus 4.7 và GPT-5.5. Hơn nữa, độ trung thực và hiệu suất căn chỉnh cũng được cải thiện, tỷ lệ lỗi mã giảm khoảng 75%. (Nguồn: ME)