Qwen3.6-35B (无思考)

Qwen3.6-35B-A3B-uncensored-heretic-APEX-I-Compact.gguf · Q4_K_M · 16.1 GB

🧠 MoE (3B active)📦 16.1 GB⚡ In 766 t/s · Out 62.6 t/s🎮 RTX 5070 Ti 16GB + 128GB RAM📅 2026-06-19

加权总分

79.6

TC×0.3 + BF×0.3 + HA×0.4

ToolCall-15

83.3

12/15 通过 · 80%

BugFind-15

80.7

11/15 通过 · 73%

HermesAgent-20

76

13/20 通过 · 65%

📋 全部测试结果

全部 (50)

ToolCall (15)

BugFind (15)

HermesAgent (20)

❌ 失败 (12)

#	题目	测试包	难度	结果	得分	sandbox	耗时	失败类型	点评

🔍 错题分析

🌊 📊 模型评估总结

✅ 优势

推理速度 62.6 t/s，作为 MoE 模型（3B active）效率较高
HermesAgent 得分 76，通过了大部分 Agent 场景测试
无思考模式，适合需要快速响应且不需要深度推理的场景

⚠️ 不足

ToolCall 分数仅 83.3，在所有模型中最低，工具调用能力不足
Trap 题（BF-03/BF-10）全部失败
HA-07 代码批量处理、HA-10 技能发现、HA-16 消息投递均失败

📋 测试环境

硬件 — RTX 5070 Ti 16GB + 128GB RAM，MoE模型部分专家层offload到CPU
推理后端 — llama.cpp
测试包 — ToolCall-15 / BugFind-15 / HermesAgent-20（共 50 题）
模型下载 — HF: SC117

Qwen3.6-35B 无思考版就像一个不爱动脑子的学霸——基础知识扎实，简单题秒杀，但遇到复杂问题就犯懒。ToolCall 83.3 分全场最低说明它在工具调用上确实有点笨手笨脚，但 62.6 t/s 的速度和 16.9GB 的体积让它当日常助手还是够用的。