TaxEval 是一个专注于税务领域的语言模型评估工具,支持多种评估指标并提供详细的评估报告,便于集成到现有的税务应用中。
用于LLM360评估和分析的代码库,包含了多种评估指标和分析方法,旨在帮助用户全面理解和优化模型表现。
Tonic Validate Metrics 是一个开源的评估指标包,旨在为生成模型的输出提供多种评估指标,支持模型性能对比,易于集成到机器学习工作流,并兼容多种数据格式和输入类型。
关于使用CommonGen-lite数据集对LLM进行评估的研究,使用了GPT-4模型进行评估,比较了不同模型的性能,并列出了排行榜上的模型结果。
一个用于算法交易回测的教程,旨在帮助用户理解和实现回测策略。
Graphite Note是一个无代码机器学习平台,让用户在几分钟内生成商业洞察和预测,旨在成为全球最易于使用的机器学习平台,适合所有技能水平的用户。用户只需导入来自CRM、在线商店、客户数据库或其他来源的原始数据,平台便会自动生成算法来回答商业问题,结果以图表、图形和表格的形式组织,方便与团队分享。
Ludwig v0.8是一个开源的低代码框架,旨在帮助开发者轻松构建先进的机器学习模型,特别是优化用于使用私有数据构建定制的大型语言模型(LLM)。它提供了一种声明式接口,使得模型的构建过程更加高效和简便。
TransferAttack是一个基于PyTorch的框架,旨在提升图像分类中的对抗性传递性,提供评估和攻击模型的功能,并对已有的传递性攻击进行分类和评估。
Recap是一个加密税务软件和投资组合追踪器,用户可以轻松跟踪其加密资产并生成税务报告。它支持多种交易所和钱包,确保所有交易自动记录和计算。Recap通过在用户设备上加密所有账户数据来优先考虑用户隐私。
MergeUI是一个直观的用户界面,旨在帮助用户探索在Hugging Face上合并的语言模型(LLMs)。通过合并模型,用户可以以低廉的成本创建强大的语言模型,无需GPU。该工具提供了有关模型合并的建议,帮助用户决定合并哪些模型以及使用什么合并策略。
GetScorecard 是一个平台,允许用户创建可重用的评分卡,用于评估候选人、员工技能、风险、供应商等。用户可以轻松注册账户,定制评分标准、权重和评分系统,并使用评分卡对个人或实体进行评估,随后生成报告,安全地通过链接分享或导出为 pdf 或文本格式。