Qwen3.6-35B (无思考)

Qwen3.6-35B-A3B-uncensored-heretic-APEX-I-Compact.gguf · Q4_K_M · 16.1 GB
🧠 MoE (3B active)📦 16.1 GB⚡ In 766 t/s · Out 62.6 t/s🎮 RTX 5070 Ti 16GB + 128GB RAM📅 2026-06-19
加权总分
79.6
TC×0.3 + BF×0.3 + HA×0.4
ToolCall-15
83.3
12/15 通过 · 80%
BugFind-15
80.7
11/15 通过 · 73%
HermesAgent-20
76
13/20 通过 · 65%

📋 全部测试结果

全部 (50)
ToolCall (15)
BugFind (15)
HermesAgent (20)
❌ 失败 (12)
#题目测试包难度结果得分sandbox耗时失败类型点评

🔍 错题分析

🌊 📊 模型评估总结

✅ 优势

  • 推理速度 62.6 t/s,作为 MoE 模型(3B active)效率较高
  • HermesAgent 得分 76,通过了大部分 Agent 场景测试
  • 无思考模式,适合需要快速响应且不需要深度推理的场景

⚠️ 不足

  • ToolCall 分数仅 83.3,在所有模型中最低,工具调用能力不足
  • Trap 题(BF-03/BF-10)全部失败
  • HA-07 代码批量处理、HA-10 技能发现、HA-16 消息投递均失败

📋 测试环境

  • 硬件 — RTX 5070 Ti 16GB + 128GB RAM,MoE模型部分专家层offload到CPU
  • 推理后端 — llama.cpp
  • 测试包 — ToolCall-15 / BugFind-15 / HermesAgent-20(共 50 题)
  • 模型下载 — HF: SC117

Qwen3.6-35B 无思考版就像一个不爱动脑子的学霸——基础知识扎实,简单题秒杀,但遇到复杂问题就犯懒。ToolCall 83.3 分全场最低说明它在工具调用上确实有点笨手笨脚,但 62.6 t/s 的速度和 16.9GB 的体积让它当日常助手还是够用的。