OS Agents: A Survey on MLLM-based Agents for General Computing Devices Control,提供有关操作系统代理的研究进展、相关论文、框架、评估基准及安全隐私资源。
本项目收录了关于大型语言模型(LLM)作为优化器的关键论文,并提供了自动优化相关文献的全面列表,专注于如何优化提示以提高LLM的性能,涵盖了最新的研究进展和技术。
UnrealZoo 是一个基于 Unreal Engine 的大规模照片级虚拟世界集合,旨在为具身AI提供仿真环境,具备高质量的图形渲染和多样化的场景。
MBZUAI Bactrian-X是一个多语言可复制的指令遵循模型,使用了3.4M条指令从52种语言训练而成,提供52种单语言模型和1种多语言模型。
StructuredRAG是一个用于评估大型语言模型(LLM)遵循响应格式指令能力的六个任务基准,旨在研究不同提示策略对模型性能的影响,并提供复杂任务的性能评估。该项目还包括开源实验代码和结果,方便研究人员进行进一步探索。