Zerox 係一個超勁嘅 OCR 工具,用 gpt-4o-mini 嚟加持,零配置就用到。佢會將文件轉做圖像,之後畀 AI 處理,輸出 Markdown 格式嘅內容。支援 PDF、DOCX 同埋圖像檔如 JPEG、PNG。識別文字超準,包括手寫字、藝術字體同埋有干擾嘅文字,錯誤率低,結果高質。輸出 Markdown 乾淨,保留基本格式,方便編輯同分析。開發者可以用 Node.js 同 Python SDK,輕鬆整合到應用程式,自動化 OCR 流程,提高效率。
https://github.com/getomni-ai/zerox