黑马大赛 AI 赛道学习路线

本资料按预报名通知中的 AI 赛道考察范围整理，目标是把“理论算法、工程落地、智能体编排、星辰大模型与集团 AI+ 战略”压缩成适合手机碎片化复习的章节。

基础理论掌握 AI 问题建模、机器学习、深度学习和 Transformer 的基本概念。

大模型能力理解预训练、指令微调、对齐、RAG、评估、部署和推理优化。

实操任务围绕数据处理、大模型部署、智能体任务编排建立完整解题思路。

企业场景结合中国电信 AI+ 行动、星辰大模型和通信业务场景准备表达。

14 天复习安排

天数	学习重点	产出
第 1 天	阅读考察范围拆解，建立知识地图	写出 AI 赛道 6 个关键词
第 2-3 天	AI 基础、机器学习、深度学习	能解释分类、回归、聚类、过拟合、反向传播
第 4-5 天	Transformer 与大模型原理	能画出注意力、预训练、指令微调、推理流程
第 6-7 天	调优、RAG 与评估	能设计一个企业知识问答方案
第 8 天	数据处理	能写出数据清洗、标注、切分、质检流程
第 9 天	部署与推理优化	能说明量化、并发、显存、服务监控
第 10-11 天	智能体设计与任务编排	能设计工具调用、记忆、规划和异常处理
第 12 天	集团 AI+ 与星辰大模型	能把技术能力映射到中国电信场景
第 13 天	场景题演练	完成 3 道实战设计题
第 14 天	速记清单与自测	补齐薄弱点

详版学习地图

模块	你要能说清	你要能做出
AI 基础	分类、回归、聚类、指标、过拟合、数据泄漏	把业务问题抽象成 AI 任务
机器学习	逻辑回归、树模型、GBDT、特征工程、类别不均衡	设计结构化预测模型方案
深度学习	神经网络、Attention、Transformer、训练和推理	解释大模型为什么逐 token 生成
大模型原理	预训练、SFT、对齐、token、上下文、幻觉	写出可控 Prompt 和结构化输出
RAG 与调优	检索、切分、Embedding、Rerank、LoRA、评估	设计企业知识问答系统
数据处理	清洗、脱敏、标注、JSONL、质检报告	产出训练集、测试集和知识库 chunk
部署	量化、并发、KV Cache、监控、安全、回滚	设计上线和压测方案
智能体	工具、规划、记忆、状态机、人机协同	编排多工具任务并处理失败
AI+ 星辰	星辰底座、通信场景、集团 AI+ 表达	把技术方案讲成业务价值

每章怎么学

每章建议按四遍走：

第一遍看表格和速记，建立概念框架。
第二遍看“模板”和“流程”，记答题结构。
第三遍看“小练习”和“加练题”，闭卷口述。
第四遍把内容套到自己岗位场景，写一页方案。

考试答题原则

题型	答题重点
概念题	定义 + 原理 + 适用场景 + 局限
算法题	任务类型 + 数据特征 + 指标 + 为什么选这个算法
RAG 题	文档处理 + 检索 + 重排 + 生成 + 引用 + 权限
微调题	样本格式 + 数据质量 + 训练方式 + 固定测试集
部署题	模型选型 + 显存 + 并发 + 监控 + 安全 + 回滚
智能体题	目标 + 工具 + 状态机 + 失败处理 + 人工确认
AI+ 场景题	业务痛点 + 星辰能力 + 数据治理 + 评估指标 + 成果转化

备赛目标

看到场景题时，先识别任务类型：分类、生成、检索增强、智能体编排、部署优化或数据治理。
回答理论题时，优先给出“定义、关键机制、优缺点、适用场景、风险控制”。
回答实操题时，按“数据、模型、工具、流程、评估、安全、上线运维”展开。
涉及集团 AI+、星辰大模型、息壤等公司能力时，以正式培训材料和内部平台说明为准，本资料只整理公开信息与通用技术框架。

推荐阅读顺序

每天复习结束前，用 3 句话复述当天内容：一句定义、一句关键技术、一句业务落地。能复述出来，才算真正掌握。

最小闭环练习

如果只剩半天时间，至少做完这 5 个闭环：

用 5 分钟解释 RAG，并画出“文档 -> 切分 -> 向量化 -> 检索 -> 重排 -> 生成 -> 引用”流程。
用 5 分钟解释 LoRA 适合什么、不适合什么。
用 10 分钟写出“客服工单摘要与派单”方案。
用 10 分钟写出“网络告警归因智能体”方案。
用 10 分钟写出“基于星辰大模型的 AI+ 营业厅政策助手”方案。