产研学协同:词元无限 × 北航全国重点实验室联合研究成果
词元无限团队
01 学术与工程一体:产研学协同
词元无限与北京航空航天大学开展深度合作,将高校在复杂关键软件与智能化方法上的基础研究,与工业界真实研发场景、产品化与验证闭环相对接,形成“问题来自工程、方法沉淀为学术、成果反哺产品”的良性循环。学术上的可发表创新,与工程上的可复现、可落地互为支撑,使技术路线既经得起论文与公开基准检验,也能持续服务用户与业务。
02 合作实验室
复杂关键软件环境全国重点实验室(原软件开发环境国家重点实验室)依托北京航空航天大学建设,是我国信息领域最早的重点实验室之一。实验室定位于复杂关键软件环境的应用基础研究,加强现代工程和技术科学研究,聚焦开发效率、可信保障和持续演化,重点研制开发运行一体化智能软件环境,强化复杂关键软件技术链、产业链和生态链的支撑能力。
03 合作论文导读
1. InfCode:面向可靠软件缺陷修复的对抗式迭代精炼框架
针对真实仓库级 issue 修复中“测试不足、补丁看似通过验证却未真正消除根因”等问题,论文提出 InfCode:在容器化环境中,由测试补丁生成器与代码补丁生成器进行对抗式迭代,协同精炼测试与补丁,并由选择器(Selector)筛选更可信的修复方案。在 SWE-bench Lite、SWE-bench Verified 等基准上,InfCode 相较强基线取得稳定提升;在 SWE-bench Verified 上报告 79.4% 量级表现,并开源实现,便于社区复现与扩展。
论文全文阅读:InfCode(arXiv:2511.16004)https://arxiv.org/pdf/2511.16004
2. InfCode-C++:面向 C++ 的意图引导检索与 AST 结构化检索
现有仓库级修复系统多面向 Python,依赖浅层检索与导航,难以迁移到 C++(重载、命名空间、模板、复杂控制流等)。论文提出 INFCODE-C++,将语义层面的代码意图检索与基于 AST 的确定性结构化查询结合,为大规模静态类型 C++ 仓库构建更贴合语言特性的上下文,支撑精确定位与稳健补丁生成。在 Multi-SWE-bench-CPP 上,论文报告 25.58% 的解决率,相对此前最强智能体有显著提升,并强调语义检索、结构分析与可复现执行在 C++ 场景中的关键作用。
论文全文阅读:InfCode-C++(arXiv:2511.16005)https://arxiv.org/pdf/2511.16005