类别发现

Mutual Information-Based GCD开源项目 – 通过最大化互信息解决类别发现问题

Mutual Information-Based GCD开源项目 – 通过最大化互信息解决类别发现问题

基于互信息的广义类别发现，旨在通过最大化互信息来解决广义范畴发现问题。该项目探索参数损失函数族，以评估特征和标签之间的互信息，并自动寻找最大化预测性能的损失函数。引入肘部最大质心移位(Emacs)技术，可以估计未标记集合中的类数，并在多个GCD场景下展现出通用性和竞争力，尤其在处理细粒度分类问题时表现出显著优势。

Emacs技术互信息最大化参数损失函数类别发现

LLMs Tool开源项目 – 大语言模型训练与测试工具

LLMs Tool开源项目 – 大语言模型训练与测试工具

一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测，低参数量及全参数模型训练和融合、量化。

HuggingFace大语言模型训练工具模型融合模型量化

Can We Tune Together开源项目 – 组合多种NLP语言模型

Can We Tune Together开源项目 – 组合多种NLP语言模型

该项目旨在通过结合多种自然语言处理模型，探索优化模型性能的新方法。它具有强大的可扩展性，适用于多种应用场景，并提供了用户友好的接口。

API调用NLP模型组合可扩展性模型性能优化

Retrieval-QA-Benchmark开源项目 – 评估检索增强生成系统的工具

Retrieval-QA-Benchmark开源项目 – 评估检索增强生成系统的工具

RQABench是一个开源的检索问答基准工具，旨在评估检索增强生成(RAG)系统，具有灵活性、可复现性和可追溯性等特点，支持多种RAG模型的评估并提供标准化的基准测试。

RAG模型评估开源项目检索问答基准工具评估检索增强生成系统

BIG-bench开源项目 – 全面评估AI模型性能的基准工具

BIG-bench开源项目 – 全面评估AI模型性能的基准工具

BIG-Bench是一个用于评估神经网络模型性能的基准测量工具，旨在提供全面的评估方法，通过多个任务和指标来衡量AI模型的能力。

AI模型性能评估工具基准测试大型语言模型评估

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3