BookTrans Desk
PDF / EPUB 阅读、翻译、结构化抽取和导出工具,支持 layout-aware 内容处理。
Media / Preview
BookTrans Desk project cover.
Screenshots will be added as the project interface stabilizes.
Why
我大量阅读 PDF 和 EPUB 格式的书籍、论文和资料,但现有工具要么只支持阅读,要么只支持翻译,很少有工具能同时处理阅读、翻译、结构化抽取和导出。BookTrans Desk 是我为自己打造的阅读工作台。
核心问题:如何在保持原文排版结构的前提下,高效地阅读、翻译和导出内容?
What it does
- PDF / EPUB 文件的阅读和导航
- layout-aware 内容抽取(保留段落、标题、列表结构)
- 翻译辅助(支持对照阅读和术语管理)
- 结构化导出(Markdown、HTML、JSON)
当前能力边界:主要支持文本类 PDF,对于扫描版 PDF 需要 OCR 预处理。EPUB 支持基础排版。
Current status
阶段:功能完善
已完成:基础阅读器、layout-aware 抽取、Markdown 导出
仍待完成:翻译记忆库、术语表管理、批量处理
Design notes
采用"结构优先"的设计原则。内容抽取时优先保留文档的语义结构(标题层级、段落、列表),而非视觉样式。这样导出的内容才能被其他工具正确理解和处理。
翻译辅助不追求全自动翻译,而是提供对照阅读、术语提示和翻译记忆,让人的判断始终在最前面。
Impact
对个人工作流:大幅提升了长文阅读和翻译的效率,特别是论文和书籍的结构性阅读。
复用价值:layout-aware 抽取逻辑和结构化导出可以被任何需要处理文档内容的项目复用。
Next
- 翻译记忆库和术语表管理
- 批量文件处理
- 与 ExplainLens 集成,支持论文可视化解释