招大模型日常/科研实习生，求优秀简历！

来源：主播人才网,直播人才网 时间：2025-08-15 03:55:19 作者：主播人才网,直播人才网 浏览量：

招大模型日常/科研实习生，求优秀简历！

? 团队与岗位简介https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n腾讯混元大模型 X 组，负责 Agent-RL 与推理能力（Reasoning）上限探索。我们聚焦如何通过 RL 与 agent 体系把模型能力推向极限，研究与工程双驱动，产出既有理论价值又能落地的系统与模型。实习岗位 HC：1–2 名（支持科研、鼓励发表论文）。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 你可能做什么（岗位职责）https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 参与 Agent-RL 系统/算法设计与实现，涵盖训练、评估与调优闭环。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在 code-agent 与通用 agent 场景中设计并实现 RL / post-training 策略（例如 reward model、DPO、PPO 等）。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 负责实验设计、数据处理、消融分析，并撰写报告或论文（团队鼓励在高水平会议投稿）。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 将研究成果工程化，推动模型在下游任务（如代码理解/生成、复杂推理）上的实际提升。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 我们希望你具备（必备）https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在读博士或者硕士，计算机科学、机器学习、统计学、应用数学等相关专业。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有大模型 / coding 方向研究或实践经历，熟悉主流大模型（如 deepseek-r1、Qwen 等）。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 熟悉 post-training 与 RL 训练流程，了解 reward model、DPO、PPO 等主流算法。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 扎实的工程实现能力，有实际项目经验；https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有分布式训练实操经验（DeepSpeed、Megatron 或同类框架），能在多卡/多机环境下调试与优化。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 良好的沟通与团队协作能力，能独立开展实验并撰写技术报告。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 加分项（优先考虑）https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在顶会/高水平期刊发表过相关论文。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- ACM/ICPC 类竞赛奖牌或其他高水平竞赛获奖经历。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有 code-agent、agentic-system 或 RL-based production 化经验。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 博士在读优先。长期实习优先https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 我们提供https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 真正支持科研的实习环境：资源、导师与发表支持。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 与产业级大模型工程互通的机会——你的工作能快速落地到大规模训练/推理流水线。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 导师制与技术分享、参与高水平研究与开源协作的机会。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n#互联网大厂 #实习直招 #混元 #大模型 #AgentRL #CodeAgent #DeepSpeed #ResearchFriendly

微信扫一扫分享资讯

下一篇：合肥工资待遇

招大模型日常/科研实习生，求优秀简历！

用微信扫一扫