写作风格微调工作台

Overview

工作流总览

当前应用运行链路是 FastAPI + 静态前端。下面 6 步覆盖从数据准备到训练验证的完整流程。

准备输入文档

检查环境与原始文档，确认训练数据来源正确。

生成与校验样本

切块、生成 pair，并在训练前验证结构与质量。

训练与结果检查

上传到 Modal，启动训练，并在最后做冒烟测试。

Step 1

环境检查

确认 API 密钥和 Modal Token 都已配置。

Step 2

文本准备

读取 `training_data/` 文档，抽样、变长切块并生成兼容 Step 3 的训练样本。

生成训练样本

Step 2 现在会先抽样文档，再按自然段做变长切块、风格劣化、过滤与去重。

抽样文档上限

目标样本数

最小块长度

最大块长度

优先长度下限

优先长度上限

启用结构化过滤启用 LLM 二次判断

Current activity

current_file=

last_completed=

next=

Pipeline timeline

sampling_documents → chunking → degrading → filtering

最终样本

candidate chunks

过滤

去重

Recent events

暂无事件

Per-bucket breakdown

filter_reasons=

length_mismatch=

errors=

查看日志（最近 100 条）

暂无日志

Step 3

样本校验

在训练前确认生成的训练样本结构和内容都合理。

Step 4

训练配置

选择训练硬件与参数。配置会传给 Modal 任务。

GPU 硬件

训练轮数

Batch Size

梯度累积

学习率

最大序列长度

LoRA / 优化器

LoRA Rank (r)

LoRA Alpha

LoRA Dropout

Weight Decay

Warmup Ratio

Step 5

训练监控

查看训练状态、日志、loss 与估算成本。

Train Loss

Eval Loss

已运行

估算花费

运行中

训练日志

暂无日志

Step 6

完成与验证

训练完成后做一次冒烟测试，快速检查模型输出。

写作风格微调工作台

工作流总览

环境检查

环境变量

Modal 鉴权