V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  saintube  ›  全部回复第 1 页 / 共 1 页
回复总数  19
顶一下,阿里星岗位仍在热招中~

我们团队新开的通义 ATH 的暑期实习岗位也欢迎投递:


# 通义 ATH-AI Infra 工程师(实习)

## 基础信息

- 毕业起止时间要求:2026-11-01 - 2027-10-31
- 笔试方向:阿里巴巴集团 27 届 - 工程方向

## 职位描述

在这里,你将成为大模型技术落地的“幕后推手”。你将参与构建支撑千卡/万卡规模的 AI 计算基础设施,通过软硬件协同优化,解决大模型在训练、推理、调度全链路中的工程挑战。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率,为 AI 时代的算力底座注入核心动力。

具体的职责包括以下相关方向的一项或多项:

1. 算力基建与分布式训练:
- 深入分布式训练架构,优化通信与底层算子性能,解决大规模集群通信瓶颈,提升模型训练的吞吐量与计算效率。参与研究新的训练框架和模式。
极致推理加速:
- 针对大规模推理场景,研发高性能推理引擎,通过 kernel 、框架、与算法结合的有损优化等手段,实现极致的低延迟与高并发。
2. 智能化资源调度与系统:
- 构建大规模 GPU 集群的统一调度与编排系统,实现算力资源的弹性分配与自动化调度,设计与优化面向 AI 计算场景的高性能通信、存储系统,保障海量任务的极致的效率。
3. 工程效率与平台化建设:
- 打造一体化的平台,覆盖大模型研发和迭代的全流程,降低模型迭代门槛,提升研发效能。

## 职位要求

1. 基础条件:
- 计算机、软件工程等相关专业优先。
- 热衷于数据结构和算法、在 ACM 大赛成绩优异者优先;有顶会论文/高影响项目/开源贡献者加分。
2. 专业能力:
- 系统工程与编程能力:具备良好的系统工程基础,熟悉 Linux 开发环境,掌握 Python 、Go 、Java 等至少一门编程语言,具备扎实的工程实现能力。
- 分布式系统:了解分布式系统基本原理(如一致性、容错、扩展性等)。
- AI 系统领域专业知识:对于以下领域中的一项或者多项具备专业能力
- 了解 AI 的基本原理与常见算法,理解模型训练任务的基本流程及其资源需求。
- 了解主流训练推理框架(如 PyTorch 、TensorFlow 、vLLM 、sglang )的基本使用方式及训练流程。
- 了解异构计算或高性能计算体系,有 GPU 相关优化经验者优先。
3. 能力特质:
- 沟通能力:能与跨域岗位,如:算法、产品等,进行良好的沟通。
- 跨域视野:有较宽的技术视野与知识面,对算法研发流程、数据、GPU 调度、训练、推理等相关领域的技术逻辑都有涉猎。
- 系统思维: 乐于挑战复杂系统的性能极限,具备良好的性能分析与调优能力,喜欢从底层视角拆解并解决问题。
- 极客精神:对 AI 大模型技术充满热情,具备快速学习新技术的能力,渴望在高性能计算领域实现技术突破。
再顶一下,欢迎联系~
自顶一下,hc 充足,欢迎投递和交流~
还没有招满,欢迎大家投递~
热招中,欢迎大家踊跃投递~
@fengsi 我这边没听说,不过学生背景确实在初筛阶段会有一定权重。我们欢迎有对口技术背景和对这方面兴趣较强的同学投递,即使面试没有通过,我们也会争取为你转到合适的部门。
目前实习还在热招中,并非 kpi 面,对 Kubernetes 、容器、调度、AI Infra 感兴趣的同学欢迎投递~
2020 年 11 月 22 日
回复了 dick20cm 创建的主题 程序员 受够了 996 从大厂 quit 半年学英语和找 PhD 坑,一无所获
PhD 和 996 不是互斥的
2020 年 11 月 17 日
回复了 sundx 创建的主题 职场话题 应届 offer 求分析
建议钉钉 sp
3090 最近出现了几波爆炸事故,甚至涉及到海盗船 ax1600i 这种电源,建议观望
2020 年 10 月 27 日
回复了 proxytoworld 创建的主题 职场话题 各位 21 届应届生大佬现在拿到的 offer 薪资多少啊
补充 11 楼,T 厂今年 base 是 17/18.5/20/21.5/23k 五档,分别对应大小白菜、大小 sp 和 ssp,bonus 有 3w 签字费和 6w 、10w 、20w 三档的签字费。
A 厂才开始开奖,看 offershow 上结果是每档比去年高 2k 左右。
唯一 B 厂据说校招和去年平薪。
厕所坑位调度是指啥
2020 年 8 月 14 日
回复了 BowenXiao 创建的主题 Kubernetes 阿里云原生部门 OR 分布式存储?纠结。。
私以为业务和开源最后还是要选好侧重的,云这边还是很难说只搞开源。。
2020 年 8 月 7 日
回复了 BowenXiao 创建的主题 Kubernetes 阿里云原生部门 OR 分布式存储?纠结。。
竞争好激烈呀还有 Berkley 大佬。
云原生下面可能没有纯做分布式存储的,但应该是有 etcd 维护、镜像管理以及 CSI 相关的。
大佬角色转换得真快
您好,请问贵部门有准备近期开始实习生春招吗?
您好,贵部门近期有开始实习生春招的意向吗?我看已经有一些阿里云智能的其他部门开始春招了。
2020 年 1 月 8 日
回复了 yangchuansheng33 创建的主题 云计算 k8s 1.17.0 一步安装大法
不能设置 feature-gate 吗
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3026 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 14:59 · PVG 22:59 · LAX 07:59 · JFK 10:59
♥ Do have faith in what you're doing.