首页 >热门头条 > 正文

推理token减少46%！Meta新方法缩短思维链，告别重复推导

admin 2025-10-05 16:00热门头条 42 0

Meta新突破！缩短思维链,减少推理token使用高达46%

正文： Meta公司联合Mila-Quebec AI Institute、蒙特利尔大学和普林斯顿大学的研究团队共同提出了一种名为“元认知复用”（Metacognitive Reuse）的创新机制，旨在解决大型语言模型在处理复杂任务时，如数学和编程问题,常常陷入重复推导的困境。

这项新技术的核心在于让模型自身回顾并总结解题思路，将常用的推理步骤提炼成简洁的“行为”，并存储在一个名为“行为手册”的知识库中，这样一来，当模型再次遇到类似问题时，可以直接从手册中调用相应的行为,无需重新推导。

推理token减少46%！Meta新方法缩短思维链，告别重复推导

实验结果表明，这一机制在MATH、AIME等数学基准测试中表现优异，不仅保持了模型的准确率，还在推理token的使用上实现了显著减少，最多可降低46%。

具体来看,该机制通过以下三种应用场景实现了这一目标：

行为条件推理（BCI）：在MATH和AIME数据集上,模型使用更少的token就能达到与基线相当甚至更优的性能。
行为引导的自我改进：模型通过对自身推理轨迹的反思和修正，实现了自我优化，即使不更新参数,也能提升推理效果。
行为条件监督微调（BC-SFT）：该方法能更有效地将高质量的行为融入模型参数中,使原本不具备推理能力的模型转化为具备推理能力的模型。

通过这些创新，Meta的新方法不仅缩短了模型的思维链，还大幅提高了其效率,为大型语言模型在复杂任务处理中的应用开辟了新的可能性。

#token规则 #token解决方案 #token 机制

上一篇：马斯克，冲上热搜！人形机器人大秀中国功夫！A股这一赛道火了
下一篇：突然拉升，创历史新高！超11.8万人爆仓

相关推荐

酒价内参6月25日价格发布：五粮液1618保持不变2026-06-25
光大期货：6月25日金融日报2026-06-25
嘉高达资本因股份合并削减16.67亿股2026-06-25
华为申请“世界”商标引热议2026-06-25
半导体板块逆大盘上涨行情走弱2026-06-25
比特币再次跌破6万美元关口几大支撑力量均现动摇2026-06-25
存储芯片巨头SK海力士拟赴美上市募资290亿美元2026-06-25
Kalshi首席执行官称预测交易平台正考虑 IPO，但年内暂无上市计划2026-06-25
高争民爆：巨龙矿山目前由易普力、广东宏大两家企业提供相关爆破服务2026-06-25
摩根大通下调特斯拉第二季度汽车交付量预期2026-06-25
演员吴启华否认“手握10亿资产”2026-06-25
男子被朋友酒瓶砸头次日离世2026-06-25

最近发表

友情链接

生猪价格网