基于互信息的广义类别发现,旨在通过最大化互信息来解决广义范畴发现问题。该项目探索参数损失函数族,以评估特征和标签之间的互信息,并自动寻找最大化预测性能的损失函数。引入肘部最大质心移位(Emacs)技术,可以估计未标记集合中的类数,并在多个GCD场景下展现出通用性和竞争力,尤其在处理细粒度分类问题时表现出显著优势。
一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练和融合、量化。
该项目旨在通过结合多种自然语言处理模型,探索优化模型性能的新方法。它具有强大的可扩展性,适用于多种应用场景,并提供了用户友好的接口。
RQABench是一个开源的检索问答基准工具,旨在评估检索增强生成(RAG)系统,具有灵活性、可复现性和可追溯性等特点,支持多种RAG模型的评估并提供标准化的基准测试。
BIG-Bench是一个用于评估神经网络模型性能的基准测量工具,旨在提供全面的评估方法,通过多个任务和指标来衡量AI模型的能力。