Auto-Analyst 是一个 AI 驱动的数据分析工具,旨在简化数据科学流程。它通过集成多种 AI 代理,自动化数据预处理、统计分析、机器学习和可视化等复杂任务,提供交互式 Streamlit 接口以提升效率。项目开源,基于 MIT 许可证,未来计划包括优化提示、改进代码修复等。
Vizly是一个通过自然语言使用户能够分析数据、训练机器学习模型和生成交互式可视化的AI驱动数据分析工具。用户只需注册、上传数据,即可开始提问以生成可视化和洞察。
LLM Comparator是一个交互式数据可视化工具,旨在并排评估和分析大型语言模型的响应,由PAIR团队开发。
LLMSurvey是一个提供LLaMA模型族进化图的项目,用户可以通过该工具查看不同版本模型的性能,比较多种模型参数,并获取相关的训练和评估数据。
该项目提供一个开源LLM模型列表,这些模型在性能上达到或超过OpenAI的付费模型(如ChatGPT和GPT-4),并支持社区的贡献与反馈。
AgentBoard是一个多轮LLM智能体的分析评估排行榜,旨在评估大型语言模型的通用Agent能力。它提供全面的性能分析和可视化结果,支持多种模型的比较,帮助用户深入理解智能体在对话中的表现。
Navan.ai是一个无代码平台,允许开发者和企业在几分钟内构建和部署计算机视觉AI模型,节省高达85%的开发时间和成本。用户可以通过nStudio快速构建模型,通过nCloud将模型部署到云端,并获得推理API。此外,用户还可以选择使用预训练的视觉AI模型,如人脸检测等。
Gemini Pro vs Chat GPT是一个网站,允许用户实时比较Gemini Pro和Chat GPT的响应。用户可以输入提示,并同时获得结果以及性能指标。该网站专为需要快速比较见解的技术爱好者和专业人士设计。
mlx-llm是基于苹果MLX框架的一个应用平台,旨在为用户提供一个运行和测试语言模型的环境。它支持多种语言模型,并提供交互式实验环境,使得机器学习实验和原型开发变得更加高效。用户可以轻松集成和扩展功能,进行模型输出的可视化和调试,满足各种实验需求。
基于电子表格的深度学习模型可视化工具,帮助理解GPT内部机制,实现模型结构和数据流的可视化配置。
一款用于评估和红队任何大型语言模型(LLM)应用的简单且模块化工具,由AI验证基金会开发,集成了基准测试和红队测试,帮助AI开发者、合规团队和AI系统所有者评估LLMs和LLM应用。
一款助力强化学习训练的可视化工具,能让训练过程更易懂、调试更轻松,就像给复杂的训练流程装上了一扇透明的观察窗
基于微博开源的Rill Flow项目,旨在搭建大模型应用的技术平台,支持多种大模型的集成与管理,提供用户友好的界面用于模型训练和推理,兼容多种数据源与格式,支持分布式计算以提高模型训练效率,并具有丰富的监控与日志功能。
FLASK是一个专注于基于技能集的细粒度评估工具,能够对大语言模型(LLM)进行全面分析和比较。它提供了评估模型在不同能力上的表现,并与最先进的开源LLM进行对比,帮助用户了解模型的优势和不足。
苏秦(suqin)语言大模型全工具链 WebUI 整合包,旨在实现目前各大语言模型的全流程工具 WebUI 整合包,无需编写代码即可拥有自己的定制模型与专属应用。
该项目汇集了关于视觉生成模型评估的相关作品,包括评估指标、模型和系统的详细信息。