EvalsOne是一个旨在简化生成AI模型提示评估过程的工具,帮助用户进行质量控制和风险管理。在将生成AI模型投入生产环境之前,EvalsOne提供了一种高效的评估方式,以确保模型在与真实用户和数据交互时的可靠性。
Algomax是一个平台,旨在简化您的LLM和RAG模型评估,提升提示开发效率,并通过独特的定性指标洞察加速开发过程。该平台提供直观的仪表盘,便于您轻松集成到工作流程中,评估模型性能,评估引擎设计精准,能够深入洞察模型行为。
飞桨可信AI,基于PaddlePaddle开发的集可信分析和增强于一体的可信AI工具集,助力NLP开发者提升深度学习模型效果和可信度,推动模型安全、可靠的落地于应用
Enzyme 是一款质量管理系统软件,旨在帮助医疗设备、数字健康和生物制药公司简化质量流程,确保符合 cGMP、QSR 和 ISO 等行业标准。它覆盖产品开发生命周期的各个阶段,提供文档控制、变更控制、培训、风险管理、审计、投诉、不合格、纠正和预防措施等多种功能。
Dflux是一个集成的数据科学平台,旨在提供无缝的数据探索、分析和模型开发体验。它帮助用户快速获取可操作的洞察,提升数据分析效率,支持各类数据任务。
iPPi是一款专为房地产代理商设计的专业软件,提供更好的物业估值、估值报告及市场洞察。它通过数据驱动的见解为房地产行业赋能,节省时间、提高准确性并增加销售。用户可以在网站上注册免费试用,访问iPPi仪表板并设置偏好,快速研究可比物业并在几分钟内创建估值,仪表板还提供独家市场数据,包括当前待售/出租的库存、平均要价、平均售出/出租时间和需求指数。iPPi的数据库包括超过150万处物业的丰富历史和当前库存信息。
ReliveAI是一个无代码平台,旨在帮助企业轻松创建基于AI的工作流和代理。它提供了一个简单的界面,使用户能够高效地自动化工作流程,并轻松连接各种API。新推出的AI代理允许用户使用简单的英语进行自动化,用户可以在几分钟内开始使用。
Masthead Data帮助数据工程师实时查看异常和管道错误,无需访问或读取数据。它能够追踪所有数据流,提供列级血统信息,并具备优化云计算的功能,以提升数据管道的效率。
Airdoc.Pro 是一个平台,旨在自动化提取和组织建筑过程中的交付文档数据。它通过AI技术实现现场库存、现场登记、工程量清单的高效管理,并提供详细的供应商洞察。用户可以轻松处理扫描件、照片或PDF文件,系统会自动提取交付票据中的字段和项目,分类每一项并计算碳排放。所捕获的数据可用于最终结算、成本规划、评估和投标报告。
TradeUI是一个综合的交易平台,利用AI信号、期权流数据和先进的图表模式,帮助投资者提升交易潜力,同时提供一个活跃的交易者社区,供学习和交流。
Trazable Copilot 是一款为食品行业提供实时质量管理的工具,它能够解决查询、提供指导,并确保遵循最新的法规信息。
WorkLog.page 是一款智能的工作日志工具,旨在帮助用户轻松跟踪时间并生成评估所需的总结。通过登录并使用该软件,用户可以高效地记录工作时间,适合自由职业者、远程工作者及项目团队。
一个研究完全规避开源LLM对齐的对抗性后缀的项目,旨在探索如何识别和利用对抗性后缀,以评估和提高开源LLM模型的鲁棒性和安全性。该项目适用于多种流行的开源模型,包括ChatGPT、Claude、Bard和LLaMA-2,并提供了相关研究文献链接,以便深入了解当前的研究动态。
OpenAI API Usage Data Export是一款Chrome扩展,可以将OpenAI API的使用数据导出为CSV文件,方便用户分析和管理API使用情况。
一个用于评估AI在高考中的表现的项目,旨在通过与真实高考分数线的对比,深入了解大模型在各科目的能力。
Uniskai是一个基于AI的多云平台,帮助用户全面控制基础设施,并将虚拟资产的云支出降低多达70%。通过丰富的可视化、AI生成的策略和可操作的报告,用户能够识别支出过高的领域并优化云成本。
一个包含1,645个具有不同种类歧义的数据集及对应的评估方法的项目。
adversea是一个AI驱动的平台,帮助用户在背景调查过程中识别和评估与个人或实体合作的潜在风险。