一个全面的语音智能体测试和评估框架,帮助开发者优化LLM驱动的语音助手。它支持多种语言模型和提示词的对比测试,允许自定义评估指标,能够实现模型迁移和成本优化,同时系统地测试不同场景下的代理表现,非常适合语音助手的开发和迭代优化。
JudgeLM是经过微调的语言大模型,旨在有效、高效地在开放式基准测试中评估语言大模型(LLM),提供系统化的模型能力和行为分析,解决多种偏见问题,并在新旧基准测试中展示出色的评判性能。
GPT4All是一款在本地运行的大型语言模型(LLM),最新发布了V3.0版本,支持多种模型架构,并与多种工具和平台集成。它基于LLaMa模型,使用约80万条GPT-3.5-Turbo生成的数据进行训练,支持多种类型的对话,包括代码和故事。GPT4All完全本地运行,确保数据隐私,支持Windows、MacOS、Ubuntu等操作系统,并具有改进的UI/UX。
Prompt Flow 是微软推出的开发工具套件,旨在简化基于大语言模型(LLM)的 AI 应用程序的端到端开发周期,支持从构思、原型设计、测试、评估到生产部署和监控的全流程。它提供创建和管理可执行工作流的功能,支持与多种工具和框架的集成,并可轻松部署到云服务或本地环境。
Retell AI提供一个API,使开发者能够快速构建类人语音代理。开发者可以在一天内构建出类似《钢铁侠》中JARVIS的语音助手,而非数月。Retell AI的响应时间平均为800毫秒,达到了人类互动的水平。
Edexia是一个专为教育工作者设计的在线平台,提供批量上传、标记和下载功能,帮助教师轻松管理不同班级。它支持评分标准的定制,提供深入的反馈,帮助学生在特定领域进行改进。
该项目提供了一个关于LLM应用开发的电子书,涵盖了理论学习及实践代码,帮助理解和整合信息处理系统。
E2B桌面沙箱为大型语言模型(LLM)提供图形桌面环境的沙盒服务,旨在通过安全的计算机使用体验提供隔离的云端环境。