Structured Outputs 是 OpenAI API 中的一项新功能,主要用于 Chat Completions API 和 Assistants API。它通过 constrained decoding 技术动态约束模型输出,确保输出严格遵循开发者提供的 JSON Schema。这一功能特别适用于需要精确数据格式的任务,如数据录入、信息检索和多步骤工作流。
OpenAI于2024-08-06推出的API structured outputs功能,旨在提升API的可靠性,确保模型生成的输出与开发者提供的JSON schema完全匹配。该功能特别适用于需要精确数据格式的应用场景,如数据输入、信息检索、问答系统和多步工作流。在复杂JSON schema的评估中,新模型取得了100%的得分,显著优于之前的gpt-4-0613模型(得分不到40%)。该功能通过设置"strict: true"启用,适用于Chat Completions API和Assistants API。
Aide 是一款开源免费的 AI 辅助开发 VSCode 扩展,旨在通过提供智能工具提升开发者的编码体验。它支持多种大型语言模型(LLM),允许用户自行配置,并采用 MIT 协议,完全免费且开源。Aide 提供多种功能,如智能代码注释、代码转换、智能粘贴、批量处理文件、智能变量重命名和自定义 AI 命令,适合个人开发者或团队使用。
Artifacts 是 Anthropic 开发的 Claude AI 工具的一个功能,旨在通过专用窗口让用户创建和互动各种类型的内容,如文档、代码片段和网站设计。它支持实时预览、版本控制、发布和重混功能,适合团队协作。Artifacts 已对所有用户开放,包括免费、专业和团队计划,用户可以在网页、iOS 和 Android 平台上使用。
Qwen2.5 是由阿里巴巴云的 Qwen 团队开发的大型语言模型系列,涵盖从 0.5B 到 72B 的多种尺寸。该系列包括通用语言模型、编程模型 Qwen2.5-Coder 和数学模型 Qwen2.5-Math,适用于从终端设备到企业级系统的广泛应用。Qwen2.5 在多语言支持(超过 29 种语言)、长上下文处理(高达 128K 令牌)和多种运行框架兼容性方面表现出色。
Doubao是由火山引擎(VolcEngine)开发的综合性AI模型家族,涵盖自然语言处理、视觉理解、语音合成、视频生成等多种AI任务。其模型在知识、代码、推理和中文等多个基准测试中表现优异,部分模型如Doubao-1.5-pro优于GPT4o和Claude 3.5 Sonnet,达到全球领先水平。Doubao模型广泛应用于ByteDance的产品,如剪映、即梦AI和醒图工具,覆盖智能座舱、在线教育、社会娱乐、智能客服等领域。
Grok API是xAI公司于2024年10月推出的人工智能模型接口,支持函数调用,便于与数据库和搜索引擎集成。目前提供“grok-beta”模型,支持文本和代码生成,未来计划推出视觉模型用于图像处理。定价较高,输入token为5美元/百万,输出token为15美元/百万。与X平台深度集成,支持图像生成、新闻总结等功能。尽管功能强大,但用户报告支付和使用配额问题,数据中心运营也引发环保争议。
Kimi 探索版是由Moonshot AI推出的增强型AI搜索功能,旨在通过模拟人类思维方式处理复杂问题。其搜索量据称是普通版的10倍,一次搜索可精读500页内容。通过理解、分解、推理、搜索、分析、整合、反思和清晰表达的步骤,提供准确且实用的答案。该工具特别适合学术研究、市场分析、学习辅导、技术问题解决和决策支持等领域。
Claude 3.5 Haiku是由Anthropic开发的高性能AI模型,旨在平衡速度、成本效益和高级功能。它在编码、工具使用和推理任务中表现出色,性能与Claude 3 Opus相当,同时保持了与之前Haiku模型相似的速度。模型支持高达200k令牌的上下文,适用于多种应用场景,并通过Anthropic API、Amazon Bedrock和Google Cloud’s Vertex AI等平台提供服务。
Claude 3.5 Sonnet是Anthropic发布的高级AI语言模型,专注于编码和整体性能提升。它在推理、知识和编码能力方面表现出色,并具备增强的视觉功能和新的Artifacts功能,支持交互式内容生成。该模型特别适合处理复杂任务,如客户支持、多步骤工作流程、软件工程和视觉数据分析。
Canvas 是 OpenAI 开发的一款创新工具,通过与 ChatGPT 协作,提升写作和编码体验。它提供了一个并排工作区,用户可以在其中直接生成和编辑内容,并获得 AI 的实时辅助。Canvas 特别适合处理需要复杂多步任务的用户,如撰写长篇文章或开发复杂的代码项目。现已对所有 ChatGPT 用户开放,支持 Python 代码执行等功能。
Le Chat 是由 Mistral AI 推出的一款多功能聊天机器人,类似于 ChatGPT,支持图像生成、网络搜索、Canvas 和 PDF 上传等功能。升级后的 Le Chat 完全免费,核心功能包括网络搜索、文档和图像理解、图像生成及快速响应,相对于竞争对手有明显优势。它集成了全面的信息访问和任务支持,适合从烹饪到编码的各种需求,强调自然对话和定制化能力,特别适用于技术和非技术用户。
Project IDX 是 Google 推出的一个基于云的全栈、多平台应用开发工作空间,集成了多种 AI 工具,如 Gemini。它旨在通过提供一站式的开发环境,简化从代码编辑到部署的整个软件开发流程,提升开发团队的生产力。平台支持多种框架和语言,提供代码编辑、智能代码分析、自动测试和部署工具,特别适合需要快速迭代和跨平台开发的团队。
MarsCode 是由 ByteDance 开发的一款 AI 代码编辑器,结合了自然语言处理(NLP)和代码生成技术,旨在提升开发者的编码效率和体验。它支持多种编程语言和主流 IDE 扩展,提供了从代码编写到测试和协作的全方位辅助功能。MarsCode 是一个云端 IDE,无需下载或配置,适合直接在浏览器中使用。
Zed 是一款下一代 AI 代码编辑器,专注于人类与 AI 的高性能协作,旨在通过无缝的人工智能协作提升软件开发效率。它支持 macOS 和 Linux,Windows 版本即将推出。Zed 提供了多种功能,包括 AI 辅助编程、实时协作、多语言支持、原生 Git 支持等,适合个人和团队使用。
Codeium Windsurf Editor 是由 Codeium 开发的一款 AI 驱动的集成开发环境 (IDE),旨在通过深度整合 AI 技术提升开发者的编码效率。它是第一个代理式 IDE,结合了 Copilot(协作式)和 Agent(独立式)功能,提供超越传统助手的“心智融合”体验。特别适合需要高效处理多个项目的开发者,其 Cascade 模式可自动处理从代码生成到调试的复杂任务,简化开发流程。
ChatGPT Pro是OpenAI提供的高级订阅服务,月费约为24美元,专为需要强大AI能力的用户设计。它提供无限制访问多种高级AI模型,包括o1、o1-mini、GPT-4o和Advanced Voice,并包含o1 pro模式,适用于需要深度计算资源的复杂问题。该服务在数学、科学和编码等领域表现优异,并支持多媒体生成和深度研究扩展。
GitHub Copilot Free 是 GitHub 推出的一项免费服务,专为个人开发者设计,允许他们在 Visual Studio Code(VSCode)中使用代码补全和聊天功能。每月提供 2000 次代码补全和 50 条聊天消息,支持使用先进的 AI 模型如 GPT-4o 和 Claude 3.5 Sonnet,无需订阅或信用卡,仅需登录 GitHub 账户即可使用。这项服务旨在提升开发效率,特别适合开源项目和个人开发者。
doubao 是由 ByteDance 开发的一款 AI 聊天机器人,具备多模态处理能力,支持文本、图像和音频处理。特别擅长生成包含中文字符的图像,适合制作海报。目前免费供个人使用,但生成的图像不可用于商业用途。doubao 还提供情感支持、翻译服务和编程辅助等功能,满足用户多样化需求。
Qwen Chat 是由阿里巴巴通义团队推出的免费AI聊天平台,基于Open WebUI构建,集成了多个Qwen AI大型模型。它支持多种模型、上传文档和图片、HTML预览等功能,未来计划扩展网页搜索、图像生成和语音模式等功能。平台旨在提供用户友好的多模态AI交互体验,涵盖自然语言处理、图像理解和编码任务等多个领域。
Claude Code 是由 Anthropic 开发的基于代理的编码工具,运行于终端,通过自然语言命令加速编码过程。它直接与开发环境整合,无需额外服务器或复杂设置,适合测试驱动开发、调试复杂问题和大规模重构。目前处于研究预览的 beta 阶段,旨在收集开发者对 AI 协作偏好、工作流程优化以及代理体验改进的反馈。
Claude 3.7 Sonnet 是全球首个人工智能混合推理模型,支持标准思考(快速响应)和扩展思考(高级推理)两种模式。该模型在代码和前端开发方面表现出色,尤其在数学和科学领域有显著提升,并在宝可梦游戏测试中超越先前模型。它适用于多种场景,包括指令遵循、通用推理、多模态处理和代理编码。模型可通过多种平台访问,定价透明,适合企业和个人开发者。
Image Toolbox 是一个功能强大的图像处理工具,专为高效的照片编辑和操作而设计。它提供了丰富的功能,包括图像裁剪、滤镜应用、EXIF数据编辑、背景去除、图像转换为PDF等。无论是摄影师还是开发者,都可以通过其简洁的界面轻松完成复杂的图像处理任务。项目基于Kotlin开发,支持Android平台,并提供了多种高级功能,如批量处理、自定义滤镜、图像拼接、背景去除、水印添加、图像绘制等。
VTracer 是一个开源软件,用于将位图(如 JPG 和 PNG)转换为矢量图形(SVG)。它能够处理高分辨率扫描图像和低分辨率像素艺术,适用于历史文化资料数字化、设计工作和游戏开发等场景。与 Potrace 相比,VTracer 可以处理彩色图像,并且输出更紧凑的矢量文件。它最初设计用于处理高达千兆像素的历史蓝图扫描,同时也适用于复古游戏艺术的像素化处理。
99AI是一个可商业化的AI Web平台,提供一站式的人工智能服务解决方案。它集成了多种AI技术,包括对话、绘画、语音处理等功能,支持私有化部署和多用户管理,适合企业、团队或个人快速构建AI服务。前端使用Vite + Vue3框架,后端采用Node.js + NestJS,保证了服务的稳定性和扩展性。
ChatNio 是一个综合了多种流行AI模型和服务的一站式平台,支持OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、通义千问、腾讯混元等35+个国内外主流AI模型,涵盖文本、音频和视频等多个领域。提供分布式流式传输、图像生成、跨设备对话同步、Token弹性计费、多模型聚合、联网搜索、AI卡片、AI项目生成、批量文章生成等功能。未来还将支持RAG、数字人、TTS & STT、API网关等新功能。
OpenAI Agents SDK 是一个轻量级但功能强大的框架,专为构建多智能体工作流程而设计。它通过简化单智能体及多智能体系统的开发流程,帮助开发者快速构建AI智能体应用。该框架支持智能体配置、交接、防护机制、追踪和可视化功能,适用于客户支持自动化、多步骤研究、内容生成、代码审查和销售潜在客户挖掘等实际应用。
Supabase 是一个开源的 Firebase 替代品,提供类似于 Firebase 的开发者体验。它基于企业级开源工具构建,主要功能包括托管的 Postgres 数据库、身份验证和授权、自动生成的 API、函数、文件存储以及人工智能和向量/嵌入式工具组等。Supabase 不仅支持托管平台,还可以自托管和本地开发。它的架构由多个开源组件组成,如 Postgres、Realtime、PostgREST、GoTrue 等,旨在为开发者提供灵活且强大的后端解决方案。
NostalgiaForInfinity 是一个专为 Freqtrade 加密货币交易机器人设计的交易策略。它使用多种技术指标,包括相对强度指数(RSI)、布林带和移动平均线,来确定市场趋势和潜在的买入/卖出点。该策略已在多种市场环境中证明了其有效性,并因其稳健的性能和利润潜力而受到交易者的认可。项目支持通过 Docker 或本地运行,并提供详细的配置和测试指南。
Mesa 是一款开源的 Python 库,专门用于基于代理的建模(Agent-based Modeling, ABM),旨在模拟复杂系统并探索涌现行为。它提供了模块化的核心组件(如空间网格和代理调度器),支持基于浏览器的可视化,内置分析工具,并附带丰富的示例模型库。Mesa 的目标是成为 Python 领域的 NetLogo、Repast 或 MASON 的替代品,适用于从学术研究到实际应用的多种场景。