DeepMark是一款基准测试工具,旨在评估大型语言模型(LLM)在特定任务指标和自定义数据上的性能,帮助开发者理解模型的表现并优化其在不同场景下的应用。
Spoor是一个使用编译器插装技术的应用追踪工具,能够深入分析应用程序的性能,并提供实时监测和报告。支持多种编程语言,易于集成,适合各种开发环境。
AgentBoard是一个多轮LLM智能体的分析评估排行榜,旨在评估大型语言模型的通用Agent能力。它提供全面的性能分析和可视化结果,支持多种模型的比较,帮助用户深入理解智能体在对话中的表现。
nitro 是一个用起来比 pprof 更简单的 golang 性能分析工具,它提供更友好的性能分析体验,并支持实时性能监控,方便开发者快速集成到现有应用中。
HIA是一个端到端的组织病理学图像分析工具,利用深度学习技术,支持多种图像分析任务,提供用户友好的界面和API,并具备可扩展的模型训练和高效的图像处理流程。
VerbaGPT旨在通过大型语言模型简化数据分析过程,同时确保数据隐私不被侵犯。该项目结合了先进的自然语言处理技术,使用户能够更轻松地从数据中提取洞见,而无需担心敏感信息的泄露。
Kolena是一个AI平台,帮助知识工作者将非结构化数据转化为可操作的洞察,以便进行信息分析。
CodeThreat 是一款基于 AI 的静态应用安全测试 (SAST) 解决方案,提供全面准确的代码分析,且误报率极低,帮助开发过程中识别代码中的安全漏洞和弱点。
Zevo.ai 是一个开发工具,通过代码地图帮助团队理解大型代码库。它帮助技术团队在每次代码更改之前可视化二阶依赖和影响,从而加快调试、重构和代码发布的速度。