华为AI infra大模型面试,我跪了!!! 你们能想象吗就是那种面试官坐在对面轻飘飘问出一个问题然后我脑子里的知识库瞬间“404 Not Found”的感觉。没错刚结束的华为AI infra大模型岗面试我就是这个状态。赶紧写篇文章复盘一下。趁着记忆还热乎把那些让我当场“裂开”的问题和我的真实反应记录下来。不是为了吐槽是真的想帮大家感受一下这种硬核岗位的面试到底长什么样。面试总共两面连着面的没给我太多喘息机会。说实话现在回想起来手心还有点冒汗。一面技术硬核招招致命一面面试官一看就是技术出身问题非常直接基本没废话。“聊聊你微调Qwen的时候踩过什么坑”这个问题我事先准备过所以还算稳。我说了数据集质量的问题——刚开始用开源数据直接训练损失函数下降得很漂亮但生成的答案完全没法看。后来发现是数据里混了大量噪声模型学到的是“如何说废话”而不是“如何回答问题”。面试官点了点头紧接着就问“训练参数怎么设的每个参数是干嘛的”这个问题看着基础但很见功力。你不能只说学习率设了多少得说清楚为什么这么设。我当时大概这么回的学习率选的 2e-4用的余弦退火调度。这个值不是拍脑袋定的是我先用 1e-5 到 1e-3 跑了个小范围搜索发现 2e-4 附近收敛最稳。这个值要是太大微调时预训练权重会被迅速覆盖灾难性遗忘就来了太小呢模型根本学不动新数据。LoRA 的 rank 设的 64。rank 控制低秩矩阵的表达能力。rank 太低微调效果差rank 太高计算量上去了而且容易过拟合。我当时用的 QLoRA所以还涉及 4-bit 量化的配置。“那你怎么评估微调出来的模型”这是个开放性问题。我分了三层自动化指标在验证集上算 loss 和 perplexity这是基础门槛。任务指标针对下游任务算准确率、F1 这些。比如我做的文本分类任务就看分类准确率有没有提升。人工评估生成式任务光看指标不够。我会自己看生成样例从相关性、逻辑连贯性、格式遵循度几个维度打分。这里面试官没追问算是过了。QLoRAQLoRA 这块问得比较细。我说的核心思路是QLoRA 4-bit NormalFloat 量化 Double Quantization LoRA。关键点是量化只针对基础模型权重LoRA 的 adapter 权重还是用 BF16 存。这样显存占用只有原来的一半左右但效果能逼近全参数微调。“Agent 的架构你了解吗”这块我知道一些但不算特别深。我画了个简单的图来解释Agent 核心就三件事规划下一步做什么、记忆之前做了什么、有什么知识、工具调用怎么跟外部交互。然后他顺着问“ReAct 和 CoT 的区别”这个我比较熟。CoTChain of Thought是“想清楚了再回答”就是让模型一步步推理最后输出答案。整个过程是线性的推理过程和最终输出是分开的。ReActReason Act是“边想边做”。每一步都是“思考 → 行动 → 观察结果 → 再思考”。它更适合需要和外部环境交互的任务比如查资料、调用 API。CoT 适合纯推理问题ReAct 适合需要行动反馈的问题。“记忆系统怎么设计”这个问题我开始有点虚了。我说了短期记忆和长期记忆的区分。短期记忆就是当前的对话上下文存的是最近几轮交互。长期记忆需要外部向量数据库把历史信息 embedding 后存进去需要的时候做相似性检索。面试官追问了检索策略我说了 RAG 那套结合相似度阈值和 top-k 召回。致命问题来了“对GPU底层计算有了解吗”到这里我开始冒汗了。我说了解一些 CUDA 编程的基础知道 kernel 函数、线程块的概念。但说实话我对底层算子优化、Tensor Core 的具体指令、L2 Cache 的管理这些真不熟。面试官很温和“没关系那KV Cache了解吗”我KV Cache这个我真没深入用过只能硬着头皮说原理。Transformer 推理的时候decoder 是自回归的每生成一个新 token都要重新计算前面所有 token 的 Key 和 Value。这显然很蠢。KV Cache 就是把之前算好的 K 和 V 存起来新 token 只算自己的 Q然后跟缓存里的 K、V 做 attention。这样复杂度从 O(n²) 降到 O(n)。面试官点了点头没继续追问。但我心里清楚这块我答得不够深。比如显存怎么管理、PageAttention 是怎么回事、连续批处理怎么做这些都没能展开说。手撕代码优先级任务调度最后一道手撕题。题目大概是实现一个任务调度器任务有优先级和执行时间要求按优先级调度同优先级按提交顺序。这题不算难我用优先队列堆实现的。但写的时候还是有点紧张边界条件差点漏了。大概逻辑就是维护一个时间戳每次从堆顶取出优先级最高的任务执行执行完后时间推进然后继续取下一个一面结束后没有反问环节直接进入二面。我连水都没来得及喝一口。二面综合面反而更紧张二面面试官明显风格不同更像综合面 HR面的混合体。“自我介绍以及你报的哪个岗位”我又来了一遍自我介绍。然后明确说了是 AI infra 训推方向。“针对这个岗位你有什么优势”这个问题我觉得是全场最关键的一题。我的回答分了三条线算法理解能力知道模型怎么训、为什么这么训、工程落地能力Docker、K8s、推理服务部署都做过、性能意识训练的时候就会关注吞吐量和显存占用不是只管 loss 下降。说实话第三条是临时加的因为一面让我意识到这个岗位对底层性能非常看重。“为什么从福大转到杭电”这个问题有点私人。我如实说了研究方向更匹配导师的项目跟大模型相关而且杭州的互联网氛围更好。面试官看起来接受了。“美赛经历”我简单说了下美赛的建模题用机器学习做预测拿了什么奖。这块不是重点一两句带过。“说说华为的价值观”这道题我真没想到。说实话我背过但背得不太熟。我说了“以客户为中心以奋斗者为本长期艰苦奋斗”这些。面试官听了没说什么但我感觉他们更想听到的是我怎么理解这些价值观而不是背诵原文。“你来实习的话期待是什么”我说了三点想接触真正的千卡、万卡训练集群学校没这条件想把训练和推理的整套 pipeline 跑通想跟高水平的人学东西。01什么是AI大模型应用开发工程师如果说AI大模型是蕴藏着巨大能量的“后台超级能力”那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。AI大模型应用开发工程师是基于AI大模型设计开发落地业务的应用工程师。这个职业的核心价值在于打破技术与用户之间的壁垒把普通人难以理解的算法逻辑、模型参数转化为人人都能轻松操作的产品形态。无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能还是办公场景中的自动记账工具、会议记录用的语音转文字APP这些看似简单的应用背后都是应用开发工程师在默默搭建技术与需求之间的桥梁。他们不追求创造全新的大模型而是专注于让已有的大模型“听懂”业务需求“学会”解决具体问题最终形成可落地、可使用的产品。CSDN粉丝独家福利给大家整理了一份AI大模型全套学习资料这份完整版的 AI 大模型学习资料已经上传CSDN朋友们如果需要可以扫描下方二维码点击下方CSDN官方认证链接免费领取【保证100%免费】02AI大模型应用开发工程师的核心职责需求分析与拆解是工作的起点也是确保开发不偏离方向的关键。应用开发工程师需要直接对接业务方深入理解其核心诉求——不仅要明确“要做什么”更要厘清“为什么要做”以及“做到什么程度算合格”。在此基础上他们会将模糊的业务需求拆解为具体的技术任务明确每个环节的执行标准并评估技术实现的可行性同时定义清晰的核心指标为后续开发、测试提供依据。这一步就像建筑前的图纸设计若出现偏差后续所有工作都可能白费。技术选型与适配是衔接需求与开发的核心环节。工程师需要根据业务场景的特点选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同选型的合理性直接影响最终产品的表现。同时他们还要对行业相关数据进行预处理通过提示词工程优化模型输出或在必要时进行轻量化微调让基础模型更好地适配具体业务。此外设计合理的上下文管理规则确保模型理解连贯需求建立敏感信息过滤机制保障数据安全也是这一环节的重要内容。应用开发与对接则是将方案转化为产品的实操阶段。工程师会利用选定的开发框架构建应用的核心功能同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通确保数据流转顺畅。在这一过程中他们还需要配合设计团队打磨前端交互界面让技术功能以简洁易懂的方式呈现给用户实现从技术方案到产品形态的转化。测试与优化是保障产品质量的关键步骤。工程师会开展全面的功能测试找出并修复开发过程中出现的漏洞同时针对模型的响应速度、稳定性等性能指标进行优化。安全合规性也是测试的重点需要确保应用符合数据保护、隐私安全等相关规定。此外他们还会收集用户反馈通过调整模型参数、优化提示词等方式持续提升产品体验让应用更贴合用户实际使用需求。部署运维与迭代则贯穿产品的整个生命周期。工程师会通过云服务器或私有服务器将应用部署上线并实时监控运行状态及时处理突发故障确保应用稳定运行。随着业务需求的变化他们还需要对应用功能进行迭代更新同时编写完善的开发文档和使用手册为后续的维护和交接提供支持。03薪资情况与职业价值市场对这一职业的高度认可直接体现在薪资待遇上。据猎聘最新在招岗位数据显示AI大模型应用开发工程师的月薪最高可达60k。在AI技术加速落地的当下这种“技术业务”的复合型能力尤为稀缺让该职业成为当下极具吸引力的就业选择。AI大模型应用开发工程师是AI技术落地的关键桥梁。他们用专业能力将抽象的技术转化为具体的产品让大模型的价值真正渗透到各行各业。随着AI场景化应用的不断深化这一职业的重要性将更加凸显也必将吸引更多人才投身其中推动AI技术更好地服务于社会发展。CSDN粉丝独家福利给大家整理了一份AI大模型全套学习资料这份完整版的 AI 大模型学习资料已经上传CSDN朋友们如果需要可以扫描下方二维码点击下方CSDN官方认证链接免费领取【保证100%免费】