关于我 / 简历

北京航空航天大学电子信息硕士,研究方向为强化学习与多智能体协同控制。

所在城市

北京

目标岗位

AI Agent 算法工程师 / 强化学习算法工程师

北京航空航天大学电子信息硕士在读,聚焦强化学习、多智能体协同控制与无人系统任务规划。具备算法研究、系统建模与工程实现协同能力,关注 AI Agent 在复杂任务场景中的落地价值。

教育

北京航空航天大学(985)

2024.09 - 至今

自动化科学与电气工程学院 · 电子信息(硕士)

  • 导师:周锐(教授、博导),飞行器控制一体化技术国防科技重点实验室。
  • 研究方向:机器学习、强化学习、多智能体控制、无人自主控制。
  • 学生工作:北航校研会副主席、自动化学院研会主席。

北京林业大学(211)

2020.09 - 2024.06

自动化学院 · 自动化(人工智能)

  • 主要荣誉:国家奖学金、北京市优秀毕业生、宝钢奖学金、一等学业奖学金。

科研项目

大规模无人集群任务筹划与编队维持技术

2024.09 - 2024.12

航天创新研究院 · 技术负责人

  • 职责:负责目标分配、队形形成与重构的核心算法设计。
  • 方法:设计位置动态自适应分配、三维编队控制与运动控制算法。
  • 结果:实现大规模无人集群快速集结、编队形成与灵活队形调整。

无人机集群任务规划

2024.05 - 至今

航天二院 · 技术负责人

  • 职责:负责集群集结方案、聚类编组策略与防撞方案设计。
  • 方法:基于诱导航线跟踪控制实现编队飞行,并结合重构与避障算法。
  • 结果:形成可支撑实时任务规划的集群协同控制方案。

数据驱动的制导智能方法研究

2024.10 - 2024.12

中国航天一院 · 技术负责人

  • 职责:构建导弹弹道与可达区快速计算模型。
  • 方法:采用并行数据生成与清洗流程,结合多类神经网络建模。
  • 结果:可达区平均误差控制在 0.5% 以内。

基于大语言模型和强化学习的多机协同任务规划

2025.11 - 至今

硕士毕业设计

  • 职责:研究动态与静态场景下的协同决策与资源调度算法。
  • 方法:提出一体式耦合优化与分层式解耦规划两类模型。
  • 结果:在复杂约束场景中兼顾全局优化效果与实时计算能力。

实习与实践

小米

2026.01 - 2026.03

AI Agent 算法工程师(寒假实习)

  • 职责:参与游戏场景 AI Agent 能力建设与应用验证。
  • 方法:基于 MIMO 基座模型优化上下文建模、记忆机制与多轮决策链路。
  • 结果:提升玩家连续行为模拟能力,并为终端策略优化提供技术支撑。

字节跳动(电商)

2025.08 - 2025.09

多模态大模型应用岗(暑期实习)

  • 职责:参与抖音直播场景多模态大模型研究与应用探索。
  • 方法:主导构建面向下一代交互体验的大规模训练数据集。
  • 结果:验证了多模态内容理解在实时互动场景中的技术可行性。

飞书

2024.01 - 2024.03

CV 开发岗(校企合作)

  • 职责:参与图像内容理解与结构化数据处理算法迭代。
  • 方法:搭建“数据清洗-模型训练-效果评估”自动化链路。
  • 结果:提升数据质量与模型迭代效率,增强产品化落地能力。

北航校研会/院研会

2025.07 - 至今

副主席 / 主席

  • 职责:统筹大型活动与校企合作项目,推进学生组织协同运营。
  • 结果:与字节、腾讯、滴滴等企业开展合作,累计争取赞助约 7 万元。

学术成果

Context-Aware Relational Learning for Cooperative UAV Formation

第一作者

Journal of Beijing Institute of Technology(EI)

  • 提出 CORAL 多智能体深度强化学习框架,融合情境感知与关系学习模块。
  • 在奖励稀疏场景下提升协同探索效率与队友意图建模能力。

一种基于双层深度强化学习的多任务无人机协同决策与规划调度方法

第一作者

信息与控制(EI、中文核心)

  • 提出 DAP-DRL 双层解耦框架,分别优化任务分配与路径规划。
  • 设计三阶段协同训练策略,实现双层模型稳定耦合优化。

竞赛经历

美国大学生数学建模竞赛

2023.02

特等奖提名(Finalist) · 队长

全国大学生数学建模竞赛

2022.10

北京赛区二等奖 · 队员

第十六届全国大学生智能汽车竞赛

2022.07

华北赛区二等奖 · 队长

森林火灾烟雾图像检测系统

2022.10 - 2023.05

北京挑战杯一等奖 · 队长

技能栈

C++PythonMATLABPyTorchROSReinforcement LearningMachine LearningMulti-Agent SystemsPath PlanningAI Agent