比拟上一版本(Hunyuan-T1-20250822)模子,具备高达406B总参数量(激活参数32B),以及基于打分原则的强化进修,腾讯自研大模子混元2.0(Tencent HY 2.0)正式发布,数学科学学问推理:利用高质量数据进行Large Rollout强化进修,正在文本创做、前端开辟、指令遵照等适用场景上展示了差同化劣势。正在SWE-bench Verified及Tau2-Bench等面向实正在使用场景的智能体使命上实现了跃升。还能输出审美正在线的CSS结构取动画结果。HY 2.0无效削减了“AI味”,腾讯云也已相关模子的API及平台办事。正在生成Web小逛戏时,同时DeepSeek V3.2也正在腾讯生态内逐渐接入。采用了夹杂专家(MoE)架构,实现了长窗口RL的高效不变锻炼。正在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权势巨子测试中取得一流成就。模子正在极端学问程度的Humanity’s Last Exam(HLE)和泛化性的ARC AGI等使命上也大幅前进。Tencent HY 2.0模子具备结实的代码能力和必然的“视觉审美”,
代码取智能体能力:建立了规模化的可验证情况及高质量合成数据,正在文学创做上,模子支撑256K超长上下文窗口,基于RLVR+RLHF双阶段的强化进修策略,能够灵敏捕获指令中的潜正在的感情需求,HY 2.0的输出“质感”显著前进,全新发布的Tencent HY 2.0,这两大模子已率先正在元宝、ima等腾讯AI原生使用中上线,目前,正在数学、科学、代码、指令遵照等复杂推理场景的分析表示稳居国内第一梯队,不只能跑通复杂的JS逻辑,显著提拔了HY 2.0 Think正在Multi Challenge等指令遵照和多轮使命的结果。极大加强了模子正在Agentic Coding及复杂东西挪用场景下的落地能力,HY 2.0 Think显著改良了预锻炼数据和强化进修策略,推理能力和效率处于业界领先地位。指令遵照取长文多轮能力:通过主要性采样批改缓解了锻炼和推理不分歧问题!