OpenAgent Evaluation Platform
可追问的 Coding Agent 评测证据框架:围绕 TaskSpec、workspace isolation、trace.jsonl、artifact、quality gate、replay 和 scorecard / report。边界:不声称企业级、生产级、无人审核执行或商业化 SaaS;planned 能力只作为后续方向。
项目页先回答证据问题
这里不把准备中的项目包装成完成案例。每一个项目档案都要说明定位、已实现能力、未实现能力、可验证方式和边界。
可追问的 Coding Agent 评测证据框架:围绕 TaskSpec、workspace isolation、trace.jsonl、artifact、quality gate、replay 和 scorecard / report。边界:不声称企业级、生产级、无人审核执行或商业化 SaaS;planned 能力只作为后续方向。
面向邮件、报价、知识库和任务流的业务 Agent 工作流脱敏概览。边界:只保留抽象流程、人工审核点和证据留存方式;不公开原始沟通、交易细节或组织内文件。状态:已发布脱敏概览,不写成完整上线产品。
内容治理方法与证据边界项目,用来把私有资料、项目复盘、联网校验、内容分级和证据索引收敛为 public-safe 的公开表达。边界:只展示脱敏判断、结构、证据类型和边界原则;私有知识库原文、原始 source manifest、真实业务资料和内部文件留在私有侧。