OmniSQL是一个专注于文本到SQL转换的工具,旨在帮助非技术用户通过自然语言查询数据库。其核心是SynSQL-2.5M数据集,包含254万高质量样本,覆盖16,583个数据库,支持从简单到高度复杂的SQL查询。该项目还提供7B、14B、32B三种规模的开源模型,在多个基准数据集上表现优异,性能与领先的闭源模型相当或更优。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型