招大模型日常/科研实习生,求优秀简历!
来源:主播人才网,直播人才网
时间:2025-08-15 03:55:19
作者:主播人才网,直播人才网
浏览量:
招大模型日常/科研实习生,求优秀简历!

? 团队与岗位简介https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n腾讯混元大模型 X 组,负责 Agent-RL 与推理能力(Reasoning)上限探索。我们聚焦如何通过 RL 与 agent 体系把模型能力推向极限,研究与工程双驱动,产出既有理论价值又能落地的系统与模型。实习岗位 HC:1–2 名(支持科研、鼓励发表论文)。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 你可能做什么(岗位职责)https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 参与 Agent-RL 系统/算法设计与实现,涵盖训练、评估与调优闭环。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在 code-agent 与通用 agent 场景中设计并实现 RL / post-training 策略(例如 reward model、DPO、PPO 等)。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 负责实验设计、数据处理、消融分析,并撰写报告或论文(团队鼓励在高水平会议投稿)。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 将研究成果工程化,推动模型在下游任务(如代码理解/生成、复杂推理)上的实际提升。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 我们希望你具备(必备)https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在读博士或者硕士,计算机科学、机器学习、统计学、应用数学等相关专业。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有大模型 / coding 方向研究或实践经历,熟悉主流大模型(如 deepseek-r1、Qwen 等)。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 熟悉 post-training 与 RL 训练流程,了解 reward model、DPO、PPO 等主流算法。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 扎实的工程实现能力,有实际项目经验;https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有分布式训练实操经验(DeepSpeed、Megatron 或同类框架),能在多卡/多机环境下调试与优化。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 良好的沟通与团队协作能力,能独立开展实验并撰写技术报告。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 加分项(优先考虑)https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 在顶会/高水平期刊发表过相关论文。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- ACM/ICPC 类竞赛奖牌或其他高水平竞赛获奖经历。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 有 code-agent、agentic-system 或 RL-based production 化经验。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 博士在读优先。长期实习优先https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n? 我们提供https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 真正支持科研的实习环境:资源、导师与发表支持。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 与产业级大模型工程互通的机会——你的工作能快速落地到大规模训练/推理流水线。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n- 导师制与技术分享、参与高水平研究与开源协作的机会。https://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cnhttps://www.zbrczp.cn\n#互联网大厂 #实习直招 #混元 #大模型 #AgentRL #CodeAgent #DeepSpeed #ResearchFriendly