Humanity's Last Exam (HLE) 是一个多模态基准,位于人类知识的前沿,旨在成为此类学术基准的最终封闭式评估,覆盖广泛的学科领域。
该项目是一份多模态大语言模型相关论文和资源的阅读清单,旨在汇集、分类和整理最新的研究成果,帮助研究人员和开发者了解多模态LLM的进展和最佳实践。
Non finito是一个专注于多模态模型评估的工具,旨在为用户提供简单易用的平台,以便比较不同模型并公开分享评估结果。与大多数只关注语言模型的工具不同,Non finito强调多模态模型的重要性,确保每个人都能轻松进行模型评估。
该项目是一个多模态大语言模型在数学、STEM及编程领域的论文集合,旨在整合和分享最新的研究成果,推动相关领域的创新与发展。
assess.com是一个在线测试平台,旨在通过评估候选人、开发考试和分析结果来提升评估系统的效率。它结合了人工智能和心理测量技术,适用于教育评估、人力资源认证考试和预雇佣测试等场景。
该项目汇总了与多模态大语言模型(LLM)相关的研究论文和资源,提供最新的研究趋势和进展,支持多种模态的学习方法,适用于学术研究和工程实践。