阿里云/ATH-容器 AI Infra-2027 届暑期实习/阿里星招聘

4 月 16 日
 saintube

一年一度的实习招聘启动啦,今年招收容器调度、AI Infra 相关的以下 2 个岗位,HC 目前充足,欢迎交流~

阿里云/ATH-AI Infra 工程师-容器方向

岗位职责

你将成为大模型技术落地的“算力内核设计者”。你将深入 Kubernetes 生态,参与构建支撑超大规模 AI 集群的容器化基础设施,通过对调度、存储、网络等核心组件的深度定制与优化,打破大模型训练与推理的工程瓶颈。你的代码将直接优化 Agent 的冷启动速度,提升 GPU 集群的吞吐量与资源利用率,为 AI 时代的算力底座注入极致性能。

具体的职责包括以下相关方向的一项或多项:

  1. AI 容器调度与编排优化:
  1. AI 高性能存储与网络底座:
  1. AI 工程平台架构设计与效率提升:
  1. AI 基础设施极致加速:

岗位要求

  1. 毕业起止时间要求

2026-11-01 - 2027-10-31

  1. 基础条件:
  1. 专业能力:
  1. 能力特质:
  1. 工作地点

北京/杭州

构建 AI Agent 下一代调度与计算引擎-阿里星

岗位职责

  1. 构建既能实现极致性能(百毫秒唤醒)又能做到极致成本效益(资源利用率提升 XX%)的 Agent 基础设施底座;
  2. 主导设计和实现融合了 Agent Sandbox 、容器与虚拟化的统一调度系统。

岗位要求

  1. 毕业起止时间要求:2026-11-01 - 2027-10-31
  2. 计算机科学或相关专业背景,具备深厚的操作系统、分布式系统理论基础;
  3. 精通 Go/C++/Rust 中至少一种,具备大型、复杂底层系统或分布式调度系统的设计与开发经验;
  4. 熟悉 Kubernetes 架构,特别是其调度器( kube-scheduler )和资源管理机制;有二次开发或重度使用经验者优先;
  5. 深入理解 Linux 内核机制(如 cgroups 、namespaces 、内存管理、内核调度)或虚拟化技术( KVM, QEMU );
  6. 对解决复杂系统中的性能瓶颈与稳定性问题充满热情,并具备体系化的方法论;
  7. 有强烈技术热情和好奇心,自驱力和学习力强;具备良好的分析与解决问题的能力、沟通以及团队合作能力;喜欢挑战性的技术研发工作,善于攻坚克难,有创新热情,积极乐观,坚韧抗压,结果导向,能够持续推动问题的解决和突破。

加分项 :

  1. 有分布式系统调度算法(如 Borg 、Omega 、Mesos )的设计或研究经验;
  2. 有 eBPF 、CRIU 、gVisor 、Kata Containers 等云原生前沿技术的实践经验;
  3. 有 Hypervisor ( KVM/Xen )开发或性能优化经验;
  4. 在 Linux Kernel 、Kubernetes 、Docker 等顶级开源社区有活跃贡献;
  5. 掌握 AI 基础知识,掌握基础提示词工程,会使用 Al 专业工具,集成 AI 到个人工作流;有 AI 相关开发工具应用研发经验者优先,持有阿里云 ACA/ACP/ACE 认证证书者优先。

工作地点:

北京/杭州

( ps. 阿里星岗位和常规岗位实习统一招聘,根据面试评级调整,大家不要担心因为从常规岗位的内推而无法参与 A star 评级)

投递方式

发送简历到邮箱,并等待内推邮件确认:

mailto: rougang.hrg@alibaba-inc.com

或者扫描以下内推二维码:

https://uploadfiles.nowcoder.com/compress/mw1000/images/20260406/702387425_1775483579918/95299E308A1FB7120110DBF6EB2BA29F

有疑问也欢迎私信交流~

1464 次点击
所在节点    酷工作
3 条回复
saintube
4 月 17 日
自顶一下,hc 充足,欢迎投递和交流~
saintube
4 月 20 日
再顶一下,欢迎联系~
saintube
5 月 7 日
顶一下,阿里星岗位仍在热招中~

我们团队新开的通义 ATH 的暑期实习岗位也欢迎投递:


# 通义 ATH-AI Infra 工程师(实习)

## 基础信息

- 毕业起止时间要求:2026-11-01 - 2027-10-31
- 笔试方向:阿里巴巴集团 27 届 - 工程方向

## 职位描述

在这里,你将成为大模型技术落地的“幕后推手”。你将参与构建支撑千卡/万卡规模的 AI 计算基础设施,通过软硬件协同优化,解决大模型在训练、推理、调度全链路中的工程挑战。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率,为 AI 时代的算力底座注入核心动力。

具体的职责包括以下相关方向的一项或多项:

1. 算力基建与分布式训练:
- 深入分布式训练架构,优化通信与底层算子性能,解决大规模集群通信瓶颈,提升模型训练的吞吐量与计算效率。参与研究新的训练框架和模式。
极致推理加速:
- 针对大规模推理场景,研发高性能推理引擎,通过 kernel 、框架、与算法结合的有损优化等手段,实现极致的低延迟与高并发。
2. 智能化资源调度与系统:
- 构建大规模 GPU 集群的统一调度与编排系统,实现算力资源的弹性分配与自动化调度,设计与优化面向 AI 计算场景的高性能通信、存储系统,保障海量任务的极致的效率。
3. 工程效率与平台化建设:
- 打造一体化的平台,覆盖大模型研发和迭代的全流程,降低模型迭代门槛,提升研发效能。

## 职位要求

1. 基础条件:
- 计算机、软件工程等相关专业优先。
- 热衷于数据结构和算法、在 ACM 大赛成绩优异者优先;有顶会论文/高影响项目/开源贡献者加分。
2. 专业能力:
- 系统工程与编程能力:具备良好的系统工程基础,熟悉 Linux 开发环境,掌握 Python 、Go 、Java 等至少一门编程语言,具备扎实的工程实现能力。
- 分布式系统:了解分布式系统基本原理(如一致性、容错、扩展性等)。
- AI 系统领域专业知识:对于以下领域中的一项或者多项具备专业能力
- 了解 AI 的基本原理与常见算法,理解模型训练任务的基本流程及其资源需求。
- 了解主流训练推理框架(如 PyTorch 、TensorFlow 、vLLM 、sglang )的基本使用方式及训练流程。
- 了解异构计算或高性能计算体系,有 GPU 相关优化经验者优先。
3. 能力特质:
- 沟通能力:能与跨域岗位,如:算法、产品等,进行良好的沟通。
- 跨域视野:有较宽的技术视野与知识面,对算法研发流程、数据、GPU 调度、训练、推理等相关领域的技术逻辑都有涉猎。
- 系统思维: 乐于挑战复杂系统的性能极限,具备良好的性能分析与调优能力,喜欢从底层视角拆解并解决问题。
- 极客精神:对 AI 大模型技术充满热情,具备快速学习新技术的能力,渴望在高性能计算领域实现技术突破。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1206256

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX