شارك معكم كيف أستخدم سبعة نماذج لبناء بيئة عمل Harness engineering. النافذة الكبيرة مقسمة إلى جزئين، اليسار Codex واليمين Zellij موحد لجلسات العمل.
Codex معروف للجميع، بينما Zellij هو وحدة طرفية تدير عدة طرفيات، يمكن فتح العديد من الطرفيات المستقلة لإدارة الذاكرة بشكل موحد. عند بدء تشغيل جلسة محددة، يمكن استرجاع جميع الطرفيات والتخطيطات التي تم فتحها في المرة السابقة، واستعادة السياق تلقائيًا (بديل لـ tmux، بدأ استخدام tmux كان صعبًا للغاية. ميزة zellij هي القدرة على استخدام الماوس للوصول إلى طرفيات مختلفة، وتحديد النصوص ونسخها تلقائيًا إلى الحافظة)
فيما يتعلق بالنماذج، استخدمت سبعة نماذج: Gpt5.5، Grok4.3، Gemini 3.1، Glm5.1، Composer2.5، Kimi (اشتركت في عضوية claude بمبلغ عشرين دولار، كانت عملية احتيال، غير موثوق بها، فقط في الأوقات الحرجة أتواصل مع Gpt لتبادل الأفكار)
التقسيم كالتالي:
1️⃣ الإطار والسيطرة على المنتج:
Gpt5.5: هو المصمم الرئيسي، مسؤول عن الإطار، توزيع المهام، المراجعة النهائية واتخاذ القرارات.
Grok4.3: مسؤول عن مراجعة النسخة الأولى، يطرح أسئلة المطورين، يقدم مراجعة نهائية لـ gpt.
2️⃣ المطورون: Gemini، Glm5.1، Composer2.5، Kimi2.6. بناءً على مستند تدفق المهام الذي نظمه Gpt، يقومون بتطوير المهام بشكل متزامن.
بعد كل دورة تطوير، يقوم Grok بإجراء مراجعة موحدة للنسخة الأولى ويرسل التعليقات إلى Gpt للمراجعة النهائية. إذا كانت هناك أخطاء، سيعطي Gpt تعليمات محددة للنموذج لإعادة العمل. إذا تم قبولها، تنتقل إلى الدورة التالية من توزيع المهام 🔄
جميع هذه العمليات واستعادة السياق والتكامل وتحديد موقع النموذج مكتوبة في وثيقة Agent، كبيئة Harness engineering. تحتوي على معايير تطوير من andrej-karpathy-skills/CLAUDE.md.
كود Claude يحتوي على وضع ديناميكي للعمل التدريجي. يقوم Claude بتحديد تعقيد المهام تلقائيًا، ويقوم بتنظيم وكالات فرعية متوازية لتحقيق عمليات متعددة مثل “understand → change → verify” دون الحاجة إلى تدخل يدوي من المستخدم.
يمكننا لاحقًا تجربة السماح لـ cc بالسيطرة على العملية بأكملها كدماغ تحكم، للقيام بجولات مختلفة من التطوير. طالما أن حدود معايير Harness محددة بوضوح، والمطالب الشخصية والتصميم موضحة مسبقًا باستخدام وضع Plan، سيكون التشغيل بمثابة مذبحة توكنز 🐷
#BTC #vibecoding