在线教育系统测试面试题

本文档包含 18 道在线教育系统方向的高频面试题，覆盖业务模型、直播大小班课、互动课堂、白板与课件、答题器、AI 课堂分析、在线考试、防作弊、判卷与成绩、录播回放、学员管理、家校沟通、合规（双减/备案/未保）与开学季稳定性。在线教育是大厂（猿辅导、作业帮、新东方、好未来、网易有道、字节大力教育）测试岗的热门方向，2021 年双减后业态变化大，但 K12 素质、职业教育、留学、企业培训仍持续活跃，准备时要结合自己接触过的业务定位差异化场景。

一、业务模型与直播课（4题）

Q1: 在线教育系统的业务模型和分层架构是什么样？

答案：

在线教育是个"重业务 + 重技术"的双重领域，业务上涉及课程、班级、学员、教师、教研、销售；技术上又涉及直播、IM、白板、回放、AI 课堂分析等。先把业务模型说清楚再展开测试关注点。

在线教育的业务特点：

「人 + 课」双线索。一边管"班级 / 学员 / 教师"的关系，一边管"课程 / 课节 / 内容"的结构，两线索叠加产生"课表 / 上课记录 / 学情数据"。

教学 + 服务双重属性。一节课不只是直播流，还有课前预习、课中互动、课后作业、课中辅助答疑、家长查看学情。

强监管。国内 K12 双减后强监管学科类，留学/职业/素质类相对宽松；所有业态都受未保法、合同法、广告法约束。

低容错。课上 1 分钟卡顿就有可能引发大量投诉甚至退费，事故级别比一般 To C 业务还高。

测试视角下，每一层都有自己的关注点：

直播课。RTC 稳定性、白板同步、课件同步、互动信令、课堂数据。

回放。录制完整性、跨进度同步、清晰度档位。

作业 / 考试。题型多样、判分准确、防作弊。

学员 / 家长端。学情可视化、报告、家校沟通。

合规。内容审核、备案信息、未成年人保护、退费政策。

在线教育测试岗位的资深同学常常是"半个产品经理"，因为业务规则复杂、跨端跨角色多，需要把整个教学闭环都跑通。

Q2: 大班课、小班课、1v1 课的差异和各自测试要点？

答案：

在线教育按"师生比"划分三类课型，每种课型的技术架构和测试关注点差异巨大。

维度	大班课	小班课	1v1 课
师生比	1:几十 ~ 1:几千	1:6 ~ 1:20	1:1
互动深度	弱（弹幕、连麦少量）	强（每个学员能发言）	极强（全程双向）
RTC 拓扑	主播推流 + CDN 拉流	SFU 多对多	P2P 或 SFU
延迟要求	标准（3 秒）或低延迟（1 秒）	超低延迟（< 500ms）	超低延迟（< 300ms）
客单价	低（几十~几百）	中（几百~几千）	高（几千~几万）

大班课测试要点。

直播稳定。万人在线场景下的稳定性，详见直播章节 27-Q15、Q17。

弹幕与互动。海量弹幕的过审与分发、点赞、举手、答题器等轻量互动（详见 Q7）。

讲师推流。讲师端推流稳定性、屏幕共享、PPT 同步。

录制完整。一节课从开始到结束的完整录制，用于回放和事后补课。

答题器。万人同时答题的并发能力，答题数据实时统计。

营销与转化。大班课多用于体验课、引流课，测试要覆盖"转正价课"的转化链路。

小班课测试要点。

每个学员都是"主角"。每个学员都有自己的摄像头、麦克风、答题器，要测每个角色的体验。

发言权管理。讲师能否管理学员的麦克风、能否单独点学员发言。

举手与互动。学员举手、抢答、被点名站起来回答，要测信令同步和 UI 状态。

分组讨论。小班课经常分小组讨论（如英语口语），要测分房间、组内对话、讲师巡视各组。

互动游戏。一些产品有"贴星贴""转盘抽奖""课堂积分"等课中游戏。

学员家长围观。部分小班课家长可以围观但不发言，要测旁听角色的权限。

1v1 课测试要点。

师生 1 对 1 强对话。详见 RTC 章节 31-Q10。

排课与匹配。1v1 经常涉及"师生互选"，要测匹配算法、试听课、续约。

价格弹性。每节课单独计费，要测时长精确（分秒级）、超时计费、提前下课退费。

教师收入。1v1 老师按课时结算，要测课时确认（学员/教师/平台三方）、扣课时、补课时。

对话录像。部分 1v1 课要全程录像用于督导和教研，录像完整性是合规重点。

教研内容定制。1v1 课经常根据学员情况定制教学内容，要测教研工具和定制化课件下发。

测试策略上建议每种课型建独立用例集，因为技术栈和业务规则差异很大，混在一起容易遗漏。

Q3: 直播课特有功能（举手、连麦、屏幕共享、白板）怎么测？

答案：

直播课比纯直播多了大量"教学专属"功能，每个都涉及多端信令和实时交互。

举手测试。

学员端点击举手按钮，讲师端立刻看到举手列表。

测试要点：

信令延迟。举手到讲师看到 < 1 秒。

举手计数。讲师能看到"有 5 人举手"的提示。

排队顺序。多人举手时按时间排序，讲师按顺序点名。

取消举手。学员能取消举手，讲师列表实时更新。

举手限频。防止学员频繁举手干扰课堂。

连麦测试（学员从"听" → "说"）。

讲师点名某学员发言，该学员被"邀请上麦"，可以开摄像头、麦克风发言。其他学员能看到该学员。

测试要点：

上麦流程。讲师点名 → 学员收到邀请 → 学员确认上麦 → 学员开始 RTC 推流 → 全班看到该学员画面。

下麦流程。学员发言完毕讲师点"下麦"，学员的画面消失，回到普通学员状态。

异常路径。学员上麦后掉线、学员上麦但摄像头/麦克风权限被拒、学员上麦中网络变差。

并发连麦。多个学员同时被连麦（小班课常见），UI 布局自动适配。

权限。讲师能强制下麦某学员、能禁言某学员。

屏幕共享测试。

讲师共享电脑屏幕给学员，常用于演示 PPT 之外的内容（如代码、画图、其他软件）。

测试要点：

共享发起。讲师选择共享内容（整个屏幕 / 某窗口 / 某应用）。

清晰度。共享内容在学员端清晰可见，文字不糊。

帧率。共享内容流畅，特别是动态内容（视频、动画）。

延迟。讲师操作到学员看到 < 1 秒。

音频同步。如果共享时也共享系统音频（如播放视频），音视频同步。

结束共享。讲师结束共享，学员回到普通课堂视图。

跨平台。讲师用 Mac、Windows、iPad，学员用各种端，共享体验一致。

互动白板测试。

讲师在白板上画图、写字，学员实时看到，可能也能在白板上画。详见 Q5。

讲师与学员协作测试。

学员上麦时讲师能否单独和该学员对话，其他学员"旁听"。

讲师能否给学员"开权限"（如允许学员控制白板、允许学员操作课件）。

特别要测的边界场景。

讲师中途离开。讲师网络断开几秒能否恢复，讲师强制退出课堂的处理。

学员中途加入。课程开始 10 分钟后学员加入，能否看到当前课件、能否回看已开始的内容。

学员中途离开。学员退出又再进入，状态恢复。

并发操作。讲师操作 A 课件的同时另一个讲师助手操作 B 课件，状态机如何处理。

直播课功能测试是体力活，建议把每个互动功能都做成专项用例集，每次大版本发布全量回归。

Q4: 课堂互动信令（IM + RTC + 课件同步）怎么测？

答案：

在线课堂本质是"多端实时同步"系统，融合了 IM 信令（举手、消息）、RTC 媒体流（音视频）、业务信令（课件翻页、白板涂鸦）三类协议，必须保证多端状态一致。

三类信令的差异：

IM 信令。文本类，要求可靠不丢、顺序正确。如举手、聊天、点赞、上下麦邀请。

RTC 媒体。音视频流，要求低延迟、流畅，丢帧可接受但延迟不可接受。

业务信令。课件翻页、白板涂鸦、答题器状态等，要求可靠 + 顺序 + 状态一致。

测试维度：

可靠性。

IM 信令丢不丢。讲师发"现在开始答题"，所有学员都应收到，离线学员重连后也应同步到。

业务信令丢不丢。讲师翻 PPT 第 5 页，所有学员都应翻到第 5 页，离线学员重连后应在第 5 页。

RTC 流恢复。音视频暂时断开后能否快速恢复。

顺序一致性。

讲师快速操作"翻页 → 涂鸦 → 翻页"，所有学员看到的顺序应一致。

不同信令通道（IM + 业务）之间的顺序，需要业务层面保证（如用统一的 sequenceId）。

跨端一致性。

讲师 PC 端、学员 iPad 端、学员 PC 端看到的状态应一致。

不同端的状态切换延迟（如讲师翻页后 PC 端 < 500ms 看到，iPad 端 < 800ms 看到）。

迟到 / 重连同步。

学员中途加入应能拉到当前状态（当前 PPT 第几页、白板上有什么涂鸦、答题器在收什么题）。

学员断网重连后状态恢复。

并发操作。

讲师和助教同时操作（如讲师翻页同时助教在白板涂鸦），状态机应正确合并。

学员同时举手抢答（抢答场景），需要"最早到达"判定，要测时钟一致性。

弱网下的同步。

弱网下信令延迟变大，要保证不丢失（用 ACK + 重传）。

弱网下 RTC 自适应降码率（详见 RTC 章节）。

UI 一致性。同步延迟变大时 UI 上要给"同步中"的提示，避免学员误以为系统坏了。

权限信令。

讲师能控制每个学员的"麦克风开关""摄像头开关""聊天禁言"等权限。

权限变更后立即对该学员生效（毫秒级）。

权限恢复（如禁言后被讲师解禁）。

测试方法。

多端联调。同时启动 4~10 个客户端（不同角色、不同端），按真实课堂场景操作。

自动化脚本。模拟讲师和多名学员的并发操作，断言所有端最终状态一致。

弱网注入。在多端中部分端注入弱网，观察其他端的体验和该端的同步表现。

回放测试。课堂结束后回放，比对回放和实时课堂的内容是否一致。

实战中"课堂同步 Bug"是用户感知最强的问题之一，建议建立"课堂同步监控"看板，按每节课统计同步成功率、延迟分布。

二、教学工具与课件（4题）

Q5: 互动白板测试要点有哪些？

答案：

互动白板是在线教育的"黑板"，讲师和学员可以在上面画图、写字、贴图、做笔记。技术上是图形渲染 + 多端同步的复合系统，是测试重头戏。

白板核心功能：

基础绘制。

线条（直线、曲线、自由画笔）。

形状（矩形、圆、三角形、多边形）。

文字（输入、字体、字号、颜色）。

图片（插入图片、拖拽缩放）。

擦除（橡皮擦、清空白板）。

撤销 / 重做。

页面管理。

多页白板，可前进后退翻页。

每页独立保存。

合并 / 拆分页面。

教学增强。

激光笔（讲师指向某处）。

聚光灯（高亮某个区域）。

放大镜。

教学工具（圆规、量角器、坐标系等数学工具）。

协作权限。

仅讲师能操作（默认）。

讲师授权学员操作（小组讨论或学员讲解时）。

某些区域允许学员操作（如学员答题区）。

测试维度：

绘制正确性。

每种工具按预期绘制（线条粗细、颜色、平滑度）。

撤销 / 重做无 Bug（连续撤销 20 次再做 20 次回到原状态）。

笔迹精度。手写笔下的笔迹平滑（特别是 iPad / Apple Pencil 场景）。

多端同步（详见 Q4）。

讲师在 PC 端画一笔，所有学员端同步显示。

同步延迟（一般 < 500ms）。

同步顺序（讲师操作"画线 → 擦除 → 画线"，学员看到顺序一致）。

学员中途加入应能看到当前白板全部内容。

性能。

复杂白板（几百个元素）的渲染流畅。

万人课堂下白板同步的服务端压力。

各种端的渲染差异（PC 性能高、iPad / 手机性能弱）。

存储与恢复。

白板内容能保存为文件（PDF、图片、白板格式）。

课后能恢复整节课的白板，时间轴回放。

讲师能复用历史白板。

权限。

讲师能授权某学员操作白板。

学员被授权后能在白板上画图。

讲师能撤销学员的操作。

学员之间不能互相影响（A 学员的操作不影响 B 学员的画笔）。

跨平台一致性。

PC（Mac / Windows）、Pad（iPad / Android Pad）、手机的白板渲染一致。

不同分辨率（4K 屏 vs 1080p vs 小屏）下白板缩放正常。

不同 DPI 下笔迹粗细适配。

异常处理。

绘制过程中断网，恢复后未提交的笔迹是否保留。

讲师误操作"清空白板"是否有撤销机会。

白板内容超过最大限制（如 1000 个元素）的提示和处理。

工具集成。

白板和 PPT 同步（在 PPT 上批注）。

白板和摄像头视频集成（讲师把摄像头画面叠到白板上）。

白板和文字识别（OCR）集成（手写公式自动转打印体）。

实战中"白板卡顿""白板不同步""学员看不到讲师的笔迹"是高频投诉，要把白板当作核心功能保障。

Q6: 课件（PPT / PDF / 视频）展示与同步测试

答案：

在线课堂的课件展示比一般 PPT 播放器更复杂，因为要做"多端同步""讲师批注""学员独立操作"等增强。

课件类型：

PPT。最常用，支持动画、过渡、备注、超链接。

PDF。结构清晰，但不支持动画。

视频。课中插播视频片段。

H5 互动课件。教育公司自研格式，支持互动按钮、答题嵌入、自定义动画。

图片 / 长图。轻量级课件。

第三方文档。Word、Excel 等，通常先转为 PDF 再展示。

测试维度：

格式兼容。

PPT 各版本兼容（PPT 2007 / 2010 / 2016 / 2019 / 365）。

PDF 各种生成工具的兼容（Word 导出、扫描件、加密 PDF）。

特殊字符、特殊字体、嵌入图片、表格。

动画。PPT 动画（淡入、飞入、自定义路径）是否还原。

中文字体。windows 字体 / Mac 字体 / 缺失字体的处理。

转码与预渲染。

服务端把课件转成图片或 PDF，避免客户端兼容性问题。

转码时长（一份 100 页 PPT 几分钟内转完）。

转码失败的提示。

预渲染缩略图（PPT 缩略列表）。

展示同步（详见 Q4）。

讲师翻页，所有学员端立即同步翻页。

讲师在某页停留多久，学员能看到。

学员可以申请"自由翻页"（特别是大班课，让学员看自己想看的页面，但讲师能"召回"统一）。

批注与互动。

讲师在 PPT 上画线、写字（叠加在课件上），所有学员看到。

讲师在 PPT 上贴答题器、投票（详见 Q7）。

学员能在自己的副本上做笔记（不影响其他学员）。

讲师对学员笔记的查看权（可见某学员的笔记）。

视频课件。

视频流畅播放，码率自适应（详见直播章节）。

讲师能"暂停 / 继续 / 拖进度条"，所有学员同步。

视频内嵌互动节点（如视频暂停后弹答题）。

视频音量、字幕、清晰度切换。

异常路径。

课件加载失败的兜底（讲师能切换备用课件）。

讲师翻页过快导致学员端跟不上的处理。

中途加入的学员能看到当前页（不能让他从第一页看）。

讲师退出又重进，课件状态恢复。

性能。

大课件（500 页 PPT）的加载和翻页速度。

低端设备（学员家长用老手机）的渲染兼容。

多课件切换。

讲师从课件 A 切到课件 B，状态保存（A 的最后浏览页、批注）。

讲师能预先排好"上课流程"，按顺序播放多份课件。

合规。

课件审核（敏感内容、版权问题）。

教研标准化（不同老师上同一课用统一课件）。

历史版本。课件改了又恢复，能查看历史版本。

测试时要把课件当作"独立子系统"，建立专项用例集，新功能上线和大版本发布都跑。

Q7: 答题器、投票、抢答工具怎么测？

答案：

课堂互动工具是教学效果的关键，也是学员参与度的核心数据来源。每种工具有自己的业务规则和并发挑战。

答题器测试：

题型支持。

单选、多选、判断、填空、连线、排序、主观题。

每种题型的答题 UI、答案校验逻辑、判分规则。

答题流程。

讲师发题 → 学员答题 → 学员提交 → 讲师查看结果 → 讲师点评。

每个环节都要测：发题时机、答题倒计时、提交后能否修改、学员看不到正确答案直到讲师公布。

并发提交。

万人课堂下同时提交答案的并发能力。

服务端排队、限流、降级策略。

答题数据实时统计（答对率、人数、平均时长）。

答题数据。

讲师端实时看到答题情况（柱状图、饼图、答题人数）。

错题分布（哪道题错最多）。

学员能看到自己的答题历史和正确答案。

数据导出（课后分析）。

异常处理。

学员答题中网络断开，恢复后答案是否还在。

学员未在规定时间内答题（超时未提交），按未答或自动提交处理。

讲师中途撤回题目（学员答了一半题目消失了）。

投票测试。

题型简单（是 / 否、选项 ABCD）。

每个学员只能投一次（防止重复）。

实时显示投票结果，柱状图实时更新。

讲师能选择"投票结束后才公布"或"实时公布"。

匿名投票 vs 实名投票。

抢答测试。

讲师发出抢答题，学员抢按按钮。

按时间最早的学员获得抢答权。

测试要点：

时钟一致性。各端时钟可能有几毫秒差异，服务端按"到达服务端时间"判定（而不是按客户端时间），避免被作弊。

并发抢答。万人同时点击的并发处理，要保证只有一个被判为最早。

弱网下的抢答。弱网学员抢答到不到达服务端，要给出"网络慢"的反馈。

防作弊。同一用户在多个设备上抢答（脚本攻击）的识别。

红包 / 奖励工具。

部分产品有"课堂红包""答对发星贴""礼物兑换"等激励工具。

红包发放规则（按答对 / 按举手 / 按表现）。

红包发放后学员能看到的反馈（金额、领取、提现）。

红包的合规（涉及金额必须符合监管要求）。

转盘抽奖 / 课堂积分。

学员积累积分能兑换奖励（虚拟徽章、实物奖品）。

测试积分计算、积分商城、兑换流程。

测试方法上常用"多端并发模拟"，启动几百个客户端模拟万人课堂的答题、抢答场景，观察服务端处理能力和数据准确性。

Q8: AI 课堂分析功能怎么测？

答案：

AI 在课堂的应用越来越多：表情识别（专注度）、举手识别、回答识别、姿态分析、声音情绪分析。这些功能既能提升教学效果，也能给运营数据支撑。

常见 AI 课堂分析功能：

学员表情 / 专注度。

通过学员摄像头识别表情（开心、困惑、走神、低头）。

聚合成"专注度"分数。

讲师看到全班专注度趋势。

举手识别。

学员举手时摄像头识别"举手姿势"，自动加入举手列表（不用点按钮）。

可与点名结合（讲师说"那位举手的同学"，AI 自动定位）。

回答识别。

学员发言时 ASR 转文字，自动分析是否答对（关键词匹配 + 语义理解）。

回答质量打分（流畅度、关键词覆盖、逻辑性）。

姿态分析。

学员是否端正坐姿、是否长时间低头看手机、是否离座。

家长端可看到学员上课姿态报告。

声音情绪。

讲师的语调情绪（活泼 / 平淡 / 激动 / 严肃）。

学员发言的紧张度。

测试维度：

识别准确率。

需要建立"金标准测试集"（人工标注的视频片段），跑模型回归看准确率。

不同光照、不同角度、不同年龄段的学员的表现。

误判率（不能把正常学员错判成"走神"，会引发家长投诉）。

实时性。

识别延迟（一般 < 2 秒）。

实时聚合到讲师端的延迟。

隐私 / 合规。

学员摄像头数据是否上传服务端、上传的是视频还是结果数据。

未成年人面部数据的合规（家长授权 + 数据脱敏 + 留存期限）。

数据用途明示（不能用于训练而未告知用户）。

数据使用限制。表情识别数据不能用于歧视性决策（如"专注度低"不能成为退费理由）。

业务联动。

讲师端 UI 显示专注度（不能显示个人具体表情，要聚合避免歧视）。

低专注度时讲师能采取行动（点名、互动）。

家长端报告（按周汇总学员表现）。

异常场景。

学员摄像头遮挡、关闭、坏掉。

学员家里有多人（家长在旁边）的识别。

学员故意做表情（试图骗 AI）。

夜间光线差的识别。

AI 测试（详见 AI 测试章节 19-23）。

模型回归、A/B 实验、可解释性、安全合规。

伦理与合规：

AI 课堂分析的"度"是行业难题。过度监控引发家长焦虑、隐私担忧、未成年人权益问题，国内 2021 年后已经普遍降低 AI 监控力度。测试同学要把"伦理评估"作为质量维度之一。

明确告知用户哪些数据被采集、做了什么处理、能否拒绝（必须能拒绝且不影响主要服务）。

实战中 AI 课堂分析的功能往往是产品差异化亮点，但风险也大，建议测试同学和合规团队紧密配合，每个新功能上线前过合规评审。

三、考试与防作弊（5题）

Q9: 在线考试系统架构和端到端测试要点？

答案：

在线考试是在线教育里最严肃的场景之一，特别是涉及升学、招聘、资格证书的考试，对系统稳定性、防作弊、合规要求极高。

考试核心链路：

考前准备。考生注册 → 报名 → 缴费 → 收到准考证 → 设备测试。

考前身份校验。考试当天人脸识别 + 身份证扫描 + 环境检查（房间内无第三人、桌面整洁）。

试卷下发。考试开始时间到，加密试卷下发到考生端，本地解密后展示。

答题。考生作答，答案实时上传服务端（防止丢失）。

实时监考。摄像头 / 麦克风 / 屏幕全程监控，AI 实时分析 + 人工监考员复核。

提交。考试时间到自动提交 / 考生主动提交。

判分。客观题机器判分，主观题人工 / AI 判分。

成绩公布。结果统计、排名、证书发放。

测试要点：

考生端测试。

环境检测。CPU、内存、网速、摄像头、麦克风、显卡是否满足要求，不满足的引导用户。

设备绑定。一个账号一台设备，防止多人同考。

防干扰。考试期间禁用切屏、复制粘贴、其他应用、网络浏览（部分考试通过浏览器锁定模式）。

试卷与答题。

试卷下发的实时性、完整性。

题型展示（详见 Q10、Q11）。

答题数据实时上传（每答一题立即保存）。

断网恢复（恢复后答案不丢失）。

防作弊（详见 Q11）。

时间控制。

考试倒计时精确（不能因为客户端时间被改而获利）。

考试时间到自动提交（强制提交，不允许用户拖延）。

每题/每段时间限制（部分考试有"做完才能下一题"的限制）。

服务端测试。

试卷分发的高并发。万人同考时几百兆的试卷压缩包同时下发，要测分发能力。

答题数据汇总。万人实时答题，每人答 100 题，服务端每秒几万次写入。

考试结束统一提交。考试时间到瞬间几万张试卷同时提交，要测处理能力。

判分性能。

客观题立即判分（毫秒级）。

主观题排队判分（小时级或天级）。

成绩计算与排名（百万级）。

考试合规。

试卷保密。试卷加密下发、解密在内存中、不落本地磁盘。

防截屏。考试期间禁止截屏、录屏。

环境监测。摄像头持续监控、识别异常环境。

数据存档。考试视频、答题数据按法规要求长期保存（一般 5 年以上）。

考试系统是教育公司里"测试同学最专业、最严谨"的方向，每次新版本要做严格的回归 + 压测 + 安全审计。

Q10: 试卷生成、组卷、抽题怎么测？

答案：

试卷生成是考试系统的核心能力，从题库到一份完整试卷涉及组卷规则、抽题算法、试题校验、版本管理。

试卷组成：

题库。后台维护的所有题目，按知识点、难度、题型分类。

知识点体系。学科 → 章节 → 小节 → 知识点，层级化结构。

题型。单选、多选、判断、填空、问答、计算、应用题等。

难度。一般 1~5 级或 ABCDE 分级。

试题元数据。题目、选项、答案、解析、考点、难度、出题年份。

组卷方式：

固定试卷。题目顺序、选项顺序都固定，所有考生看到一样的卷。

自动组卷。按规则（题型、难度、知识点比例）从题库随机选题，每个考生卷子不同。

打乱题序。题目相同但顺序打乱（防止考生抄答案）。

打乱选项序。选项内部打乱（A、B、C、D 顺序变）。

混合组卷。组合使用以上几种方式。

组卷规则（自动组卷的核心）：

题型比例。如"单选 30 道 + 多选 10 道 + 判断 10 道"。

难度分布。如"易 40% + 中 40% + 难 20%"。

知识点覆盖。如"必考章节 1、2、3，每章至少 2 题"。

总分。题目分值乘以数量等于总分。

题量。总题数符合预期。

测试维度：

组卷正确性。

按规则跑组卷，断言生成的卷子符合所有维度（题型、难度、知识点、总分）。

边界场景：题库不足时的提示、知识点缺题时的兜底（如降难度补题）。

试卷唯一性。每个考生的卷子不同（自动组卷场景）。

抽题随机性。

同一规则多次组卷，结果应不同（验证随机性）。

但不能"完全随机"，要保证某些核心题（高频考点）出现率高。

伪随机种子（用考生 ID 作为种子）保证同一考生重复进入考试看到同一份卷子。

试题校验。

题目内容无错别字、答案明确（针对客观题，答案必须唯一正确）。

选项无重复、无歧义。

题图清晰、公式渲染正确。

试题元数据完整（必填字段如答案、解析、考点都不缺）。

试题版本。

题库更新后已经发的考试不受影响（用快照机制）。

历史试卷可追溯（按版本查询）。

试题废弃。某题被发现有错误，标为废弃，后续不再使用，但历史使用记录保留。

权限。

题库的增删改有审批流程（防止单人改错）。

试卷草稿、待审、发布、归档的状态管理。

考前修改试卷。考试已经开始后能否改试卷（一般禁止）。

测试方法：

数据驱动。组卷规则文档化、用例参数化，新规则上线就跑回归。

题库巡检。定期扫描题库，统计每知识点的题量、难度分布，发现失衡。

考前抽样。每场考试发卷前抽样几份卷子人工 review，避免出错。

试卷生成失误的影响极大（影响所有考生公平性），测试同学要做到"试卷生成 0 容错"。

Q11: 在线考试防作弊机制怎么测？

答案：

防作弊是在线考试的核心难题，特别是高考模拟、研究生招考、资格证书考试等高利害考试。要建立"事前 + 事中 + 事后"完整防护体系。

事前防护：

设备审核。

设备绑定（一个账号一台设备）。

设备指纹。识别同一设备被多账号使用（一台电脑帮多人代考）。

可疑设备拒绝（如虚拟机、模拟器、远程桌面）。

环境审核。

摄像头检测周围环境（无第三人、无书本、无电子设备）。

桌面整洁度（不能有可疑物品）。

光线、声音环境（不能太暗、太吵）。

身份核验。

人脸识别（活体检测，不能用照片或视频）。

身份证扫描。

身份证 + 人脸 + 准考证三要素核验。

事中监控：

视频监控。

考生端摄像头持续录像。

录像实时上传（用 RTC 或 HTTP 流上传）。

异常自动告警（如视野中突然多了一个人）。

屏幕监控。

考生端屏幕实时上传截图（部分高利害考试 1 秒 1 张）。

桌面监控（识别有没有打开其他应用）。

切屏检测（考生切到其他窗口立即记录）。

环境监控。

麦克风采集声音，识别异常（说话声、翻书声、打字声）。

第二摄像头（手机摄像头从侧面拍）。

行为分析（AI 监考）。

视线方向。考生频繁看屏幕外（看小抄）。

人脸消失。考生离开座位。

异常表情。紧张过度可能是作弊。

多人识别。摄像头里出现第二个人。

可疑物品。书本、手机、纸条、耳机。

人工监考。

监考员一对多监控（一个监考员看 10~30 个考生画面）。

AI 标记可疑后人工复核。

实时干预（如发现作弊立即警告、断开考试）。

事后审计：

录像回查。考试结束后系统标记的可疑片段进入人工审核。

成绩异常分析。某考生答题模式异常（如最难的题全对、最简单的全错），触发人工复审。

跨考生关联。多个考生作答模式高度相似，可能存在串通。

测试维度：

各类作弊手段的识别准确率。

低头看小抄、看手机、看第二屏。

第二人帮答（房间里有人）。

远程协助（共享屏幕给他人）。

设备外作弊（耳机听答案）。

切屏 / 打开其他应用。

试卷外流（拍照、截屏）。

每种作弊手段都要：

建立"作弊样本库"（视频 + 操作记录）。

跑识别系统看真阳率。

建立"白样本库"（正常考生行为），看误判率。

防作弊响应。

实时警告。第一次发现可疑发警告。

提高监控级别。第二次发现增加监控密度（更频繁截屏、第二摄像头开启）。

强制断开。多次违规直接断开考试，本次成绩作废。

后续处罚。考试作废、禁考一段时间、记入诚信档案。

测试要点。

警告时机准确（不能误警告好学生）。

警告 UI 友好但有威慑（明确告知违规）。

强制断开机制。断开后能否恢复（一般不允许，考试作废）。

合规与公平。

误判申诉。被判作弊的考生可申诉，48 小时内人工复核反馈。

数据保留。考试视频、操作记录长期保存（5~10 年），便于追溯。

监管报送。高利害考试可能需要按法规向监管报送防作弊数据。

实战中防作弊是个长期对抗，黑产 / 代考产业链一直在演化。测试同学要建立"红蓝对抗"机制，红队尝试新作弊手段，蓝队改进识别，每月迭代。

Q12: 答题、提交、判卷和成绩怎么测？

答案：

考试的"后半场"从考生答题到拿到成绩，每个环节都有自己的测试关注点。

答题环节：

答题 UI。

题目显示清晰（题干、选项、图片、公式）。

各题型 UI 一致（单选、多选、判断、填空、问答都符合产品规范）。

答案保存（每答一题立即上传，防止网络断了丢答案）。

切题方便（题目导航、跳题、标记重做、回看答案）。

答题时间。

总倒计时（考试总时长）。

题级倒计时（部分考试有每题时限）。

考试结束前几分钟的提醒。

答题异常。

网络断开。答案能否保存到本地、网络恢复后能否同步、能否继续答题。

电量低。考生手机电量低时的提示。

意外退出。APP 崩溃、手机重启后能否恢复考试。

考试中断电（家里跳闸）后能否恢复（看考试规则）。

辅助功能。

计算器（部分考试允许）。

公式编辑器（数学考试）。

字典（语言考试）。

笔记功能（部分考试允许做笔记）。

提交环节：

主动提交。考生确认无误后提交。

被动提交。考试时间到自动提交。

紧急提交。

考试 5 分钟前给提醒。

最后 30 秒倒计时强提示。

时间到时未答完的题按默认值处理（多数为空白，少数预设默认答案）。

提交后处理。

提交成功的回执（让考生知道提交成功）。

提交后能否再修改（一般不能）。

提交时网络断开的兜底（本地保存 + 后台异步重试上传）。

判卷环节：

客观题判分（机器判分）。

按答案精确匹配。

部分对部分错的多选题处理（一般"漏选给分、错选不给分"或"全对才给分"）。

填空题判分。允许多种正确答案、忽略大小写、忽略空格。

判分速度。客观题应秒级出结果。

主观题判分。

人工判分（多数情况）。每张卷子至少 2 个老师判分，差距大的进入第三人复核。

AI 辅助判分（作文、问答题）。提取关键词、句法结构、逻辑性给分。

判分一致性。同一答案不同判分员的分数差异。

判分进度。考生可看到"判分中"状态，预估出分时间。

成绩环节。

成绩计算。

总分 = 客观题总分 + 主观题总分。

按题分值加权。

可能有"加分项"（如英语考试的口语加分）。

成绩公布。

公布时间统一（不能让部分考生先看到）。

成绩通知（短信 + 邮件 + APP 推送 + 站内信）。

排名。考生看到自己的排名、百分位、单科分数。

错题分析。

哪道题错了、正确答案、解析。

错题分类（按知识点）。

错题本，方便后续复习。

成绩复议。

成绩异议提交、人工复核、反馈结果。

通常对客观题不开放复议（机器判分不会错），对主观题可申请复议。

证书 / 报告。

考试合格证书的生成、下载、防伪。

考试报告（综合分析、能力雷达图）。

测试方法：

数据驱动。把题库、考生、答案做成测试数据，跑端到端用例。

正确性回归。每个题型、每种边界场景都有用例。

性能压测。万人同考的全链路压测。

公平性。同一答案多次判分结果一致。

成绩相关的 Bug 会引发考生投诉甚至法律纠纷，测试同学要保证 100% 准确。

Q13: 考试系统的稳定性测试（万人同考、网络抖动、断电）

答案：

考试系统的稳定性 SLA 极高（一般要求 99.99%+），因为考试有"窗口期"特点，错过就再也无法重来。每次大型考试都是测试团队的硬仗。

典型场景：

高考模拟、研究生入学考试、四六级、各类资格证书。

万人 / 几十万人同时考。

考试时长 1.5~3 小时。

考试时间窗口固定，过期作废。

稳定性挑战：

考前涌入。考试开始前 15 分钟所有考生陆续进入考试系统，登录、人脸识别、领试卷的并发极高。

考中持续负载。考试期间持续答题，答案实时上传服务端。

考末提交。考试时间到瞬间所有考生同时提交，并发再次飙升。

监考数据上传。考试期间持续上传摄像头视频、屏幕截图，对带宽和存储压力大。

测试维度：

压测目标流量。

考前 15 分钟登录峰值（如 10 万人考试，每秒涌入 1 万次登录）。

人脸识别并发（前几分钟的活体检测）。

试卷下发并发（同时下发几百兆数据）。

答题数据写入持续 QPS（每秒几万次写入）。

提交峰值（考试结束瞬间几万人同时提交）。

监考数据上传带宽（几万人每人每秒几百 K 数据流）。

故障演练。

数据库主备切换。考试中数据库主库故障，自动切到从库，期间答题数据不丢。

Redis 故障。会话 Redis 挂了考生能否继续考。

监考存储满。监考视频上传超过预期容量，要测自动扩容或降级（如降低截图频率）。

第三方依赖故障。短信通道、推送通道挂了的兜底（如改为站内信）。

网络抖动 / 断电。

考生端弱网。考生在地铁、电梯、农村等弱网环境下的体验。要测：

答题数据本地缓存（网络断开几分钟答案不丢）。

网络恢复自动同步。

弱网下还能正常继续考（不能因为网络差直接断开考试）。

考生端断电。

手机锁屏自动息屏后再唤醒，考试状态恢复。

电脑死机后重启，能否登录回考试。

意外断电（电池没电、跳闸），有恢复机会但时间不补偿。

服务端故障。

应用服务挂掉，自动重启 + 客户端自动重连。

整个机房故障，自动切到备用机房。

降级与兜底。

监考服务挂了。考试是否继续（多数选择"先保考试，事后追溯"）。

AI 监考挂了。降级到人工监考（监考员看视频流）。

主观题判分服务挂了。判分排队，后续恢复后继续。

成绩计算服务挂了。延迟出分，提前通知考生。

应急预案。

每类典型故障都有详细 SOP。

应急联系人 7x24 待命。

考试前一周做演练。

考试中实时监控 + 异常告警。

监控指标：

实时考生数（登录中、答题中、已提交）。

各接口 QPS、RT、错误率。

监考数据上传成功率、延迟。

服务端资源水位。

异常告警阈值（如错误率 > 0.5% 告警）。

测试方法：

全链路压测。考试前 1~2 周做全链路压测，目标流量为预期峰值的 1.5~2 倍。

故障演练。每月 1 次小演练，每季度 1 次大演练。

数据巡检。考试结束后扫描答题数据，对比"开始考试人数 = 实际提交人数 + 异常人数"，差异要能解释。

考生体验追踪。建立"考生故事"，从考生视角观察每个环节的体验，发现产品 + 技术问题。

考试系统是测试同学最能积累"硬核工程能力"的方向，每次重大考试的成功都是团队信誉的累积。

四、内容、运营与合规（5题）

Q14: 课程录播、回放和剪辑测试

答案：

录播能力是在线教育的"内容资产"，能力强弱直接影响产品形态（直播 + 录播双轨、纯录播课、回放业务）。

录播来源：

直播录制。直播课结束后服务端自动录制为视频，包括讲师画面 + 课件 + 白板 + 互动数据。详见直播章节 27-Q8。

讲师录制。讲师在录播工作室录制（无学员的纯演讲），后期剪辑成课。

学员录屏（PGC）。部分场景允许学员录屏作笔记。

第三方课程。引进外部课程（如名师课、海外课），转码后入库。

录播测试：

完整性。一节 60 分钟的课，录制下来必须完整无缺失。要测：

考试中讲师退出又重进的录制。

网络抖动的录制。

讲师切多个课件、白板的录制（每种内容都要正确录到）。

互动数据保留。

弹幕、举手、答题器、抢答等互动数据要和视频时间轴对齐，回放时同步呈现。

互动数据按需可隐藏（如用作"沉浸式回放"时只看视频不看弹幕）。

清晰度。

录制清晰度档位（1080p / 720p / 480p）。

转码质量（不模糊、不失真、流畅）。

回放测试：

基础播放。

播放、暂停、拖进度、倍速、清晰度切换（详见直播 27-Q5、Q6）。

跨设备进度同步（手机看到 30 分钟，PC 上继续）。

教学增强。

弹幕回放（讲师讲到某处时学员发的弹幕）。

课件同步（讲师翻到某页时学员看到）。

白板同步（讲师在白板上画的内容）。

笔记功能（学员看回放时做笔记，关联到时间点）。

倍速。

0.5x / 1x / 1.25x / 1.5x / 2x / 3x 倍速。

倍速下音频自然（不能变调）、画面流畅。

倍速下白板同步保持。

跳跃。

跳到指定时间（按目录、按章节）。

跳过开场、跳过广告（部分课）。

知识点跳转（点知识点列表跳到对应位置）。

学习数据。

观看进度（每个学员的观看百分比）。

观看时长（实际花的时间）。

观看完成率（看完整节课的比例）。

错题回看（错题对应的讲解片段）。

剪辑测试。

课后剪辑工具。讲师 / 教研把直播录制剪成短视频、片段课。

剪辑功能：

切片（按时间切）。

合并多段。

加片头片尾。

加字幕。

加封面。

转码与导出。

测试要点：

切片精度（精确到秒）。

字幕同步。

剪辑后清晰度（不应低于原视频）。

剪辑工具的稳定性（处理几小时长视频不崩）。

存储与成本。

录播视频是教育公司最大的存储开销（一个万人观看的课程，录播视频可能上百 GB）。

存储策略（热数据用高速存储、冷数据用低成本存储）。

CDN 缓存（热门课程预热到 CDN）。

清理策略（试听课 7 天后删除、正式课长期保留）。

录播测试是个长期工程，建议建立"录播质量看板"，按课程、按讲师、按学员观看数据综合监控。

Q15: 学员管理、班级和积分体系怎么测？

答案：

学员管理是在线教育的"业务底盘"，关系到教学服务质量、续费率、客单价。

学员管理：

学员档案。

基本信息（姓名、年龄、年级、家长信息）。

学习目标（提分目标、考试目标）。

学习历史（已购课程、出勤、表现）。

特殊标签（学习障碍、特殊需求）。

学员分类。

新学员、老学员、流失学员、明星学员、问题学员。

不同类别对应不同运营策略（如新学员重视引导、老学员重视续费）。

学习数据。

出勤率、作业完成率、考试分数、课堂表现、专注度。

学情报告（按周 / 月汇总）。

家长可见的简化版报告。

班级管理：

排课。

班级开课时间、上课频率（每周几次）。

排课冲突检测（同一讲师不能同时上两个班）。

学员加入班级的灵活性（中途加入怎么补课）。

班主任 / 学习管家。

每个班配一个班主任（通常是销售/客服双角色），负责沟通、答疑、续费、问题处理。

班主任后台能看到所有学员状态。

班主任和家长的 IM 聊天。

班级互动。

班级群（IM 群聊，详见 IM 章节 25 章）。

班级公告。

班级活动（线下沙龙、PK 赛）。

测试要点：

学员档案的查询、编辑、合并（同一学员可能在不同系统有多份档案）。

学情报告的数据准确性（要和实际行为一致）。

班级排课的灵活性和异常处理（讲师临时请假、学员临时退班）。

家校沟通的实时性和可追溯（详见 Q16）。

积分体系：

积分获取。

完成作业 +10 积分。

考试满分 +50 积分。

连续打卡 +30 积分。

参加活动 +20 积分。

积分使用。

兑换实物奖品（书籍、文具、玩具）。

兑换课程优惠券。

兑换虚拟物品（皮肤、徽章、头像框）。

参与抽奖。

测试要点：

积分获取规则的准确性（每个行为对应的积分按规则）。

积分计算的准确性（每日累积、每月清零、双倍活动等）。

积分有效期（一般 1 年）。

积分商城的商品库存、订单履约。

兑换流程（地址、配送、退换）。

防作弊（刷积分、积分倒卖）。

经济系统：

虚拟货币（如"学豆""星币"）。

充值、消费、退款。

汇率（人民币：学豆 = 1:10）。

财务对账（虚拟货币流通量、实际收入应一致）。

合规：

积分不能等同于人民币现金（监管对预付费、消费陷阱有规定）。

未成年人消费保护（详见 Q17）。

实战中"积分错算"是高频投诉，测试同学要把积分系统当作"金融子系统"对待，严格回归。

Q16: 家校沟通和家长端测试

答案：

家校沟通是 K12 在线教育的核心场景，家长是付费方但学员是消费方，三方（家长、学员、平台）的沟通效率决定续费率。

家长端核心功能：

学情概览。

孩子的最近表现（出勤、作业、考试）。

学情报告（按周/月）。

学习进度（已学几节、还剩几节）。

班主任沟通。

私信 / IM 聊天（详见 IM 章节）。

家长发问 / 班主任答疑。

班主任主动通知（孩子表现优秀 / 异常提醒）。

孩子学习监督。

家长能看到孩子的在线学习情况（是否在听课、专注度）。

学习时长统计。

设备使用时长（防止孩子用学习设备玩游戏）。

财务管理。

课程消费查询。

续费提醒。

退费申请。

发票申请。

测试维度：

数据可见性。

家长只能看自己孩子的数据，不能看其他孩子（隐私 + 权限）。

家长能看到的数据范围按业务规则（如某些敏感数据不展示）。

实时性。

孩子的实时学情同步到家长端（一般 < 1 分钟）。

班主任发的消息立即推送给家长。

家长发的消息及时送达班主任。

跨账号同步。

孩子的学员账号 + 家长的家长账号互相关联，数据同步。

多家长账号（父亲 + 母亲都关联同一孩子）。

孩子有多个学员账号（兄弟姐妹）的家长端管理。

家长操作权限。

家长能为孩子下单课程。

家长能代孩子续费、退费。

家长能控制孩子的设备使用（如设置每日学习时长上限）。

家长不能"代孩子上课"（部分系统通过人脸识别防止）。

家长通知。

孩子上下课通知。

孩子作业提交 / 未完成通知。

考试成绩通知。

异常告警（孩子长时间未上线、专注度异常）。

通知偏好。

家长可配置通知类型（如关闭一些不太关心的）。

免打扰时段（孩子作业时段不打扰）。

合规：

家长账号实名（必须用真实身份证）。

未成年人数据由家长授权使用。

部分功能限制（孩子单笔消费上限、需家长授权）。

监控孩子的合规边界（不能过度监控，要尊重未成年人隐私）。

特殊场景：

离异家庭。父母分别有家长账号，可能要协调谁主导。

爷爷奶奶代管。老人使用 APP 的便利性、字体大小、操作简化。

家长不在身边。家长出差时如何远程查看 / 沟通。

测试方法：

家庭角色覆盖。模拟"父亲账号 + 母亲账号 + 孩子账号"的三方协作。

跨端测试。家长用 APP / PC / 微信小程序的体验一致。

实时性验证。从孩子操作到家长收到通知的端到端延迟。

家校沟通做好了是续费率的支撑，做不好是退费的导火索。测试同学要重视这条链路。

Q17: 在线教育合规测试（双减、备案、未保、内容审核）

答案：

国内在线教育受多重监管，合规要求是测试同学必须懂的硬核知识。

双减政策（2021 年起）：

K12 学科类培训严格限制。

不得在节假日、寒暑假开展学科类培训。

不得超期收费（一次性最多 3 个月或 60 课时，金额不超过 5000 元）。

不得变相超期（如以学习卡、储值卡等方式预收）。

不得对中小学生进行学科类的"营利性培训"（部分平台转为非营利）。

测试要点：

排课系统不能在禁止时间安排学科类课程。

支付系统对单次缴费有上限校验。

学员消费数据可监管查阅。

非学科类（艺术、体育、编程、英语启蒙等）相对宽松，但要测好"类目准确性"，不能学科类课程伪装成素质类。

备案与许可：

教育部备案（学科类需办学许可证 + ICP 备案）。

地方教育局备案（线下机构需当地资质）。

广电备案（涉及视频内容传播）。

测试要点：

平台展示的资质信息（运营主体、许可证编号）正确无误。

备案过期前提醒。

监管平台对接（按要求上报数据）。

未成年人保护：

实名认证。所有用户实名（家长账号），未成年人单独账号需家长授权。

防沉迷。

每日使用时长上限（一般 1.5 小时）。

每周累计时长上限。

晚间使用限制（22:00 后限制）。

支付额度。

单笔消费上限（如 50 元）。

月度累计上限（如 200 元）。

超额需家长二次授权。

退费保护。家长申请退费的便利性，平台不得拒绝合理退费。

内容审核。

适龄性。课程内容符合年龄段（不能给低年级孩子看高年级内容、不能有不适内容）。

文化导向。爱国主义、正能量、文化自信。

性别平等。

价值观导向。

广告法合规：

不得对孩子做"恐吓式"营销（"不报班就考不上"）。

不得承诺保证效果（"100% 提分"等绝对化用语）。

不得使用国家机关名义。

不得使用学生形象做推广（监管明确禁止）。

测试要点。建立"禁用词库"，覆盖广告法禁止用词，所有营销文案过审。

数据合规：

个人信息保护法。

数据收集最小化、明示用途。

未成年人数据需家长授权。

数据安全保护、不泄露。

数据可携带（用户能导出自己的数据）。

数据可删除（注销账号后数据真正删除）。

跨境传输。如果有数据出境（如海外服务器），需要合规审批。

退费政策：

退费规则。

未上课的全额退。

上过部分课的按比例退。

服务费、教材费的扣费规则要明示。

退费时效。

申请后 X 天内必须到账（一般 7~30 天）。

超期未到账可向监管投诉。

退费便利性。

不能强制要求复杂流程。

不能克扣不合理费用。

合规测试方法：

合规清单化。把所有法律法规要求做成"合规检查清单"，每次大版本发布前过一遍。

监管模拟。模拟监管部门的检查，验证数据可追溯、可导出。

红蓝对抗。测试同学扮演"举报家长"，尝试找平台违规点。

合规演练。每季度一次模拟监管检查的演练。

合规失败的代价远高于功能 Bug（罚款、停业、品牌损失），测试同学要把合规作为最高优先级。

Q18: 开学季 / 招生季的稳定性测试怎么做？

答案：

在线教育有明显的季节性：开学季（每年 2 月、9 月）、暑期班（6~8 月）、寒假班（1~2 月）流量是平时的 3~5 倍。每个高峰期都是稳定性大考。

测试维度：

容量评估。

历史数据分析。看上一届同期峰值流量、增长率。

业务预测。运营给出招生目标、活动规划。

按目标流量 × 1.5~2 倍准备资源。

各核心链路独立评估（注册、试听课、付费、上课、答疑）。

全链路压测。

注册链路。新用户注册 + 实名认证 + 绑定家长。

下单链路。选课 + 优惠 + 支付。

试听课。万人同时上试听课的承载能力。

正式课。万人同时上正式课的承载能力。

考试。万人同考的承载能力。

每条链路单独压、最后混合压。

降级方案。

非核心功能可降级（如积分商城、社区、客服评分）。

核心功能不能降级，但可"简化"（如详细学情报告改为简略版）。

广告位停掉腾资源。

每个降级开关要测可控、可回滚。

弹性扩容。

K8s HPA 自动扩容。

预订云上紧急资源。

CDN 节点扩容。

数据库读写分离扩容。

应急预案。

每类故障的 SOP（数据库、Redis、CDN、推送、RTC 各有预案）。

应急联系人 7x24 待命。

每月一次演练。

业务运营协同。

招生活动的技术备战（如某天上线一个"9 元体验课"，要保证支付链路稳定）。

明星讲师开课的特殊保障（粉丝高并发涌入）。

新功能上线灰度。

数据准备。

试听课、正式课的课程数据准备。

教师、班主任的提前到位。

新生引导数据（前几节课的体验设计）。

监控大盘。

业务指标。注册量、付费转化率、上课率、续费率。

技术指标。各服务 QPS、RT、错误率。

异常告警。任何指标异常立即告警。

人工排查能力。监控告警后能快速定位（日志、链路追踪、错误堆栈）。

复盘。

每次高峰后做技术 + 业务复盘。

记录所有重大问题 + 处理方式 + 改进项。

下一次高峰前推进改进项落地。

实战经验：

开学季的容灾要"宁多勿少"。一次故障引发的退费 + 品牌损失远高于资源成本。

新功能上线时机要避开高峰。开学前 1 个月不再发大版本，只做严重 Bug 修复。

充足演练。压测做到目标流量 1.5~2 倍且持续 4~8 小时，故障演练每周一次。

值班响应。整个高峰期所有核心团队 7x24 待命，分钟级响应。

人员保障。提前安排好假期（特别是春节是寒假班高峰）。

在线教育的高峰是一年里最关键的几次"考试"，测试团队要把"高峰稳定性"作为年度核心 OKR 来推进。