背景
题库是一个长期持续更新的东西。过去这几个月里:
- 2025 年真题陆续补入
- 原创题库按章节逐批扩充
- 部分计算题、案例题被批量勘误
但在数据层面,每道题只知道"创建时间"和"更新时间",看不到它属于哪一轮导入。时间久了就很难回溯:"这道题是真题扩容带进来的,还是原创题补充进来的?"
做了什么
增量导入命令新增 source_ref 字段,每次导入一批 JSON 题目时:
- 批次标识:比如
gaoxiang-2024-real、original-batch-s-1000、fix-calc-round-3等 - 每道题在入库时记录自己属于哪个批次
- 同一批次的所有题目共享一个来源标识
用户会感受到的变化
- 更新记录更可信:在 /practice/updates 看"本轮新增 X 题"时,对应的真实批次是可查的
- 反馈定位更准:某位同学提到"这批计算题里有答案问题",老师可以精确到批次排查
- 长期可追溯:不需要靠"这道题 ID 大概是 2400 号所以应该是第几轮"的土办法推测
相关范围
- 题库数据治理:增量导入命令
- 题库更新记录页:为未来更精准的"本轮更新"描述打地基
这条记录的发布时间
以相关 git 提交的时间为准:2026-04-21 23:24:27。