写作风格微调工作台

从原始全文文档出发,逐步完成训练样本构造、上传、微调与验证。

Overview

工作流总览

当前应用运行链路是 FastAPI + 静态前端。下面 6 步覆盖从数据准备到训练验证的完整流程。

准备输入文档

检查环境与原始文档,确认训练数据来源正确。

生成与校验样本

切块、生成 pair,并在训练前验证结构与质量。

训练与结果检查

上传到 Modal,启动训练,并在最后做冒烟测试。

Step 1

环境检查

确认 API 密钥和 Modal Token 都已配置。

Step 2

文本准备

读取 `training_data/` 文档,抽样、变长切块并生成兼容 Step 3 的训练样本。

生成训练样本

Step 2 现在会先抽样文档,再按自然段做变长切块、风格劣化、过滤与去重。

Current activity
current_file=
last_completed=
next=
Pipeline timeline
sampling_documents → chunking → degrading → filtering
最终样本
candidate chunks
过滤
去重
Recent events
暂无事件
Per-bucket breakdown
filter_reasons=
length_mismatch=
errors=
查看日志(最近 100 条)
暂无日志
Step 3

样本校验

在训练前确认生成的训练样本结构和内容都合理。

Step 4

训练配置

选择训练硬件与参数。配置会传给 Modal 任务。

LoRA / 优化器
Step 5

训练监控

查看训练状态、日志、loss 与估算成本。

Train Loss
Eval Loss
已运行
估算花费
运行中

训练日志

暂无日志
Step 6

完成与验证

训练完成后做一次冒烟测试,快速检查模型输出。