输入
仅处理你指定的页码范围(超出范围不处理)。
本工具不会做任何专用 OCR/PDF 文档分析;仅将每页渲染为图片并交给 LLM 转写。
—
加载 PDF 后会显示总页数。
值越大越清晰但更慢;建议 1.5–2.5。
影响导出的 `main.tex` 头部。
窗口大小 / 重叠页数(用于跨页组织的稳定性)。
大模型设置(统一入口 + 多角色)
允许为规划/转写/后校验分别配置不同的 key/url/model,并提供连通性测试。
全局默认(可被角色覆盖)
浏览器直连常见会遇到 CORS;建议使用你自己的 Cloudflare Worker 代理(README 有示例)。
默认不落盘保存。
—
角色配置
转写阶段使用“转写 LLM”;章节组织可选确定性或“规划 LLM”;可选用“后校验 LLM”做语法/一致性检查。
规划 LLM
—
转写 LLM(必需)
—
后校验 LLM(可选)
—
运行
按阶段执行,运行时显示进度与日志。
转写阶段同时处理的页数;过大可能触发限流/失败。
网络错误/限流等会自动重试(带退避)。
对 LLM 给出的 bbox 做多次试探修正,减少截少/截多。
导出/导入包含已完成页 JSON 与剪裁 PNG,用于继续未完成页。
窗口级别并发(仅组织阶段)。
阶段
—
页进度
—
页面预览
日志
输出
章节树 / main.tex / 图像资源清单 / 每页 JSON。
{}
[]
[]