Appearance
黑马大赛 AI 赛道学习路线
本资料按预报名通知中的 AI 赛道考察范围整理,目标是把“理论算法、工程落地、智能体编排、星辰大模型与集团 AI+ 战略”压缩成适合手机碎片化复习的章节。
基础理论掌握 AI 问题建模、机器学习、深度学习和 Transformer 的基本概念。
大模型能力理解预训练、指令微调、对齐、RAG、评估、部署和推理优化。
实操任务围绕数据处理、大模型部署、智能体任务编排建立完整解题思路。
企业场景结合中国电信 AI+ 行动、星辰大模型和通信业务场景准备表达。
14 天复习安排
| 天数 | 学习重点 | 产出 |
|---|---|---|
| 第 1 天 | 阅读考察范围拆解,建立知识地图 | 写出 AI 赛道 6 个关键词 |
| 第 2-3 天 | AI 基础、机器学习、深度学习 | 能解释分类、回归、聚类、过拟合、反向传播 |
| 第 4-5 天 | Transformer 与大模型原理 | 能画出注意力、预训练、指令微调、推理流程 |
| 第 6-7 天 | 调优、RAG 与评估 | 能设计一个企业知识问答方案 |
| 第 8 天 | 数据处理 | 能写出数据清洗、标注、切分、质检流程 |
| 第 9 天 | 部署与推理优化 | 能说明量化、并发、显存、服务监控 |
| 第 10-11 天 | 智能体设计与任务编排 | 能设计工具调用、记忆、规划和异常处理 |
| 第 12 天 | 集团 AI+ 与星辰大模型 | 能把技术能力映射到中国电信场景 |
| 第 13 天 | 场景题演练 | 完成 3 道实战设计题 |
| 第 14 天 | 速记清单与自测 | 补齐薄弱点 |
详版学习地图
| 模块 | 你要能说清 | 你要能做出 |
|---|---|---|
| AI 基础 | 分类、回归、聚类、指标、过拟合、数据泄漏 | 把业务问题抽象成 AI 任务 |
| 机器学习 | 逻辑回归、树模型、GBDT、特征工程、类别不均衡 | 设计结构化预测模型方案 |
| 深度学习 | 神经网络、Attention、Transformer、训练和推理 | 解释大模型为什么逐 token 生成 |
| 大模型原理 | 预训练、SFT、对齐、token、上下文、幻觉 | 写出可控 Prompt 和结构化输出 |
| RAG 与调优 | 检索、切分、Embedding、Rerank、LoRA、评估 | 设计企业知识问答系统 |
| 数据处理 | 清洗、脱敏、标注、JSONL、质检报告 | 产出训练集、测试集和知识库 chunk |
| 部署 | 量化、并发、KV Cache、监控、安全、回滚 | 设计上线和压测方案 |
| 智能体 | 工具、规划、记忆、状态机、人机协同 | 编排多工具任务并处理失败 |
| AI+ 星辰 | 星辰底座、通信场景、集团 AI+ 表达 | 把技术方案讲成业务价值 |
每章怎么学
每章建议按四遍走:
- 第一遍看表格和速记,建立概念框架。
- 第二遍看“模板”和“流程”,记答题结构。
- 第三遍看“小练习”和“加练题”,闭卷口述。
- 第四遍把内容套到自己岗位场景,写一页方案。
考试答题原则
| 题型 | 答题重点 |
|---|---|
| 概念题 | 定义 + 原理 + 适用场景 + 局限 |
| 算法题 | 任务类型 + 数据特征 + 指标 + 为什么选这个算法 |
| RAG 题 | 文档处理 + 检索 + 重排 + 生成 + 引用 + 权限 |
| 微调题 | 样本格式 + 数据质量 + 训练方式 + 固定测试集 |
| 部署题 | 模型选型 + 显存 + 并发 + 监控 + 安全 + 回滚 |
| 智能体题 | 目标 + 工具 + 状态机 + 失败处理 + 人工确认 |
| AI+ 场景题 | 业务痛点 + 星辰能力 + 数据治理 + 评估指标 + 成果转化 |
备赛目标
- 看到场景题时,先识别任务类型:分类、生成、检索增强、智能体编排、部署优化或数据治理。
- 回答理论题时,优先给出“定义、关键机制、优缺点、适用场景、风险控制”。
- 回答实操题时,按“数据、模型、工具、流程、评估、安全、上线运维”展开。
- 涉及集团 AI+、星辰大模型、息壤等公司能力时,以正式培训材料和内部平台说明为准,本资料只整理公开信息与通用技术框架。
推荐阅读顺序
- 考察范围拆解
- AI 基础与问题建模
- 机器学习核心算法
- 深度学习与 Transformer
- 大模型原理
- 调优、RAG 与评估
- 数据处理实战
- 部署与推理优化
- 智能体设计与编排
- 集团 AI+ 与星辰大模型
- 业务场景实战题
- 速记清单与自测题
每天复习结束前,用 3 句话复述当天内容:一句定义、一句关键技术、一句业务落地。能复述出来,才算真正掌握。
最小闭环练习
如果只剩半天时间,至少做完这 5 个闭环:
- 用 5 分钟解释 RAG,并画出“文档 -> 切分 -> 向量化 -> 检索 -> 重排 -> 生成 -> 引用”流程。
- 用 5 分钟解释 LoRA 适合什么、不适合什么。
- 用 10 分钟写出“客服工单摘要与派单”方案。
- 用 10 分钟写出“网络告警归因智能体”方案。
- 用 10 分钟写出“基于星辰大模型的 AI+ 营业厅政策助手”方案。