sparrow 是一个利用机器学习技术从扫描文档中提取结构化数据的工具。它支持多种文档格式,并提供了一个用户友好的演示界面,方便用户测试和验证文档提取模型。该项目是开源的,代码托管在GitHub上。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型