很多人认为做 AI 工程师必须要有计算机学位。但实际情况是,这个领域目前薪水最高的构建型岗位不看你的学位——看的是你交付过什么。
两者的差距不在学历,在项目组合。
先搞清楚一个容易被搞混的关键区别:机器学习研究员发明和训练新模型,这个角色确实很吃高等数学和学术训练,但它在市场里只占一小块;AI 工程师用已有的模型构建有用的产品,这个角色更看重软件技能、产品意识和交付纪律。绝大多数开放岗位、以及你可以不需要学位就能入行的,是第二种。
你的目标是成为「用 AI 构建东西的工程师」,不是「构建 AI 本身的科学家」。这一区分能帮你省下好几个月在当下用不上的数学上。
这个角色的位置处在三个领域的交汇点:软件工程能力、对大语言模型行为的理解、产品思维。你不需要第一天就在三方面都拔尖——能胜任并且持续提升就可以,但你需要证据。
第一阶段(第 1–3 个月):老老实实学会写代码
这一步跳不过去,也是很多人最想跳的一步。
在学其他东西之前,你必须能写出真正能跑的代码。语言选 Python——几乎所有 AI 库和框架都是 Python 优先的,这不是偏好,是现实标准。
这三个月的目标不是「我看过教程了」那种程度,而是「我能从空白文件开始写出一个小程序,不用查基础语法」的程度。变量、数据类型、控制流、函数、文件操作、调用 API、错误处理、能读懂别人的代码。从第一天开始学 Git、所有东西推 GitHub,因为你的 GitHub 就是你项目组合的前半部分。
至于对数学的担忧,先放一放。你需要对基础统计有感觉,理解数字怎么变化。不需要现在就啃线性代数和微积分——深度数学对研究员有用,你是做工程的,等将来具体项目需要时再补。
这个阶段要做什么:
- 完成一个结构化 Python 课程,每天写代码,哪怕只有 30 分钟
- 从零写 5 个小程序:计算器、文件整理工具、调用公开 API 的脚本、简单数据清洗器、命令行笔记工具
- 学 Git 基础,把 5 个项目全推到公开 GitHub
- 加入一个在做同样事情的学习社群,别闷头自学
第二阶段(第 3–5 个月):掌握 LLM API
这是整个工作的核心。
聊天界面是消费级产品。AI 工程师通过 API 工作——从自己的代码里发请求,用程序处理响应。真正的杠杆在这里,熟练掌控 API 的那一刻,你就从用户变成了构建者。
学会从你自己的脚本里给模型发消息;学会处理流式响应、管理对话历史、控制输出格式、从容应对速率限制和错误。还要搞懂一个关键能力:什么样的 prompt 能拿到一个可靠、可复现、可直接投产的答案——因为在实际产品里「基本上对」就是 bug。
这个阶段还要学会工具调用(function calling)。它让你给模型赋予行动能力:调用函数、查询系统、获取数据。一旦掌握了工具调用,Agent 的世界就彻底打开了——因为 Agent 无非就是有工具、有循环的模型而已。
这个阶段要做什么:
- 拿到 API key,一小时内从 Python 脚本发出第一次调用
- 做一个命令行工具,把自己粘贴进去的任意文本做一件有用的事(汇总、翻译、分类都行)
- 做一个有记忆的聊天机器人,能在多轮对话里记住前面说的东西
- 实现工具调用:给模型一个它有权调用的函数,确保它每次都能调对
第三阶段(第 5–7 个月):构建 RAG 系统
这是能让人拿 offer 的技能,因为大多真实 AI 产品在底层做的就是这件事。
RAG 全称是 retrieval-augmented generation,思路并不复杂。模型只知道训练数据里的东西和你当前喂给它的东西。RAG 的原理就是:从你自己的数据里捞出正确的信息,然后把这些信息喂给模型,让它对从未训练过的内容也能给出准确答案。比如你的公司文档、产品手册、知识库。
你要学会:把文档拆成块(chunking),把每块转成 embedding(语义的数值化表示),存进向量数据库,针对任意问题检索最相关的块,把这些块喂给模型,让它输出有依据的答案而不是自信的瞎猜。
从头到尾做一个能真正跑起来的 RAG 应用,用真实文档,这一步就能让你超过一大堆只聊 AI 没有动手的人。这是项目组合一。
这个阶段要做什么:
- 先搞懂 embedding 和向量数据库的概念,再落实到代码
- 在一份真实文档上做一个 RAG 应用:你自己的笔记、一组 PDF、某个 wiki 都行
- 加上检索评估:它是真的找到了最相关的块,还是只找到了相邻的块
- 把它部署到别人能访问的地方,哪怕只是一个简单的托管版本
第四阶段(第 7–9 个月):构建 Agent
现在来做所有人都在聊但没几个人能真正交付的东西。
Agent 是一个可以接收目标、拆解步骤、用工具完成每一步、再根据结果决定下一步做什么的模型。RAG 应用负责回答问题,Agent 负责做完一件事。
你在第二阶段已经学了工具调用,现在把它放进一个带目标的循环里,给 Agent 多个工具,并处理好那个烦人的现实——Agent 有时候会原地绕圈、调错工具、或者直接卡住。学会构建可靠而非仅仅在 demo 里好看的东西,正是市场最缺的能力。
讲实话:demo 级的 Agent 很简单,可靠的 Agent 很难。差距在于失败处理、清晰的工具设计和评估。把精力投在这里,因为这个差距就是「可被雇佣的工程师」和「有一个炫酷视频的人」之间的分界线。
这个阶段要做什么:
- 做一个单 Agent 系统,能用多个工具完成一个真实的多步任务
- 做一个小型多 Agent 系统,两个或多个 Agent 协作或互相校验
- 加上显式的失败处理:工具调用失败或返回空时 Agent 怎么应对
- 这是项目组合二:一个能解决真实问题的多 Agent 系统
第五阶段(第 9–11 个月):学评估和部署
这是看起来很无聊但让你真正可被雇佣的阶段,也是业余选手完全跳过的阶段。
任何人都能让 AI 功能跑通一次。公司愿意付钱的是能跑通第一万次的东西。证明你能做到这点的是评估和部署能力。
评估意味着搭建一套度量系统,用来判断你的系统到底好在哪里,一次改动是让它变好了还是变坏了。对于生成类任务,你至少要度量事实准确性、相关性、与参考答案的一致性——有时候用另一个模型打分,有时候用人工审核。一个会建评估体系的工程师就是一个可以被信任上生产的工程师。
部署意味着把系统从你的笔记本搬到网上:托管它、监控它、处理负载、追踪成本、在用户发现问题之前先发现故障。这一组技能有时被称为 MLOps,哪怕只掌握最基本的概念,在可雇佣性上就已经甩开了只会在自己电脑上跑代码的人。
这个阶段要做什么:
- 为你之前的一个项目建评估套件,包含一组测试案例和打分标准
- 选一个项目正经部署,加上监控和成本追踪
- 这是项目组合三:一个带评估和监控的已部署系统
- 把「你测了什么、怎么改进」写成文档——善于「想出声」本身就是一个可雇佣的信号
第六阶段(第 11–12 个月):入职
最后一个阶段不再涉及新的技术技能,而是确保对的人看到你做过的东西。
到这一步你手上有三个真实项目:一个带评估的 RAG 应用、一个能解决真实问题的多 Agent 系统、一个带监控的已部署系统。对大多数 AI 工程岗位来说,这套组合打开的面试机会比一个硕士学位还多。现在的工作是把它摆出去。
把每个项目写成一个清晰的案例:问题是什么、你的方案、你度量了什么、你下次会怎么做。在社区里公开构建过程,分享你的经历,把拆解文章发出去。这个领域变化太快,持续公开晒成果的构建者很快就会被看见。
然后投简历,投对层级。现实中的入门路径通常是先找一个 AI 增强的软件工程岗位过度,然后转身成为纯 AI 工程师。薪资从入门约 12 万刀到资深超过 20 万刀不等,取决于公司和地点。
面试的时候,当对方问你「说说你对 Agent 工具调用失败的处理思路」或者「解释一下你怎么评估一个 RAG 系统」,你不用背诵理论,你会直接描述你做过的事情。这就是整个游戏的全部。
这个阶段要做什么:
- 为三个项目组合各写一份清晰的案例分析
- 至少发布一篇技术拆解文章,展示你是怎么解决一个困难点的
- 广泛投递,接受 AI 增强型软件工程岗位作为现实的第一步
- 面试中多聊你实际交付了什么、会怎么改进,少背概念
这条路一些实话
12 个月是一个真实的时间线,但它只在一种情况下有效:你全程都在构建东西。
读 AI 工程文章不等于成为 AI 工程师。看教程不等于建立项目组合。能靠这条路入职的人,是每个阶段都交付了东西、并且不纠结于它是否完美的人。一直停留在「准备」阶段、从来没把东西放到真实用户面前的人,才是卡住的那批。
还有一个大家都在问的问题:如果 AI 自己都能写那么多代码了,还学这个干嘛?因为总要有人设计系统、集成组件、评估输出是否正确、决定该构建什么。AI 工具让一个有能力的 AI 工程师变得更有价值,而不是更没用。能指挥这些工具、能判断它们产出质量的工程师,正是市场愿意付钱的人。你不是在学怎么和工具竞争,你是在学怎么驾驭它们。
挡在大多数人身前的那道证书门槛,其实大部分公司已经不守着了。
一年后的今天,你可以仍然对自己说「我需要先把学位拿了」。
也可以成为那个手握三个项目、用事实证明了「不需要」的工程师。
唯一挡在你和第一阶段之间的,是今天打开一个空文件。
如果你关注 AI 助手、开发工具和软件工程实践,可以关注 Aide Hub。这里会继续分享能落地的工具教程、技术观察和项目经验。