一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、单一块等多种层级的调整与实验
通过 LMSYS 的 Chatbot Arena 数据生成的大语言模型过去一年 ELO 的排名变化对比动画,帮助用户直观了解不同模型的表现和竞争力。
人工智能工作室是一个用户友好的网页应用,旨在简化超参数调优这一通常令人头疼的任务。它提供了一个直观的用户界面,允许用户轻松尝试不同的超参数,从而优化他们的模型。
FAMIE是一个快速的主动学习框架,专注于多语言信息抽取,旨在提高数据处理和模型优化的效率。它支持多种语言的信息抽取,提供用户友好的界面和灵活的模型配置,结合高效的数据标注工具,适用于快速迭代和评估不同的学习策略。
该项目旨在比较人类、GPT-4 和 GPT-4V 在抽象和推理任务上的表现,分析不同智能体在这些任务中的能力差异,为理解和提升AI模型提供数据支持。
最小化的分布式训练框架,专为教育目的设计,让你轻松学习并实验预训练Llama类模型
ChatGptImgs是一款允许用户通过修改关键词来调整他人生成的AI图像的新工具。每张图像都有其独特的特征,用户可以追踪到源图与衍生图。
Instachart 是一个将您的仪表板草图、Figma 设计稿、白板图片或 SaaS 仪表板截图转化为可用的、完全互动的仪表板的工具,并附带演示数据,从而加速原型制作过程。
一个用于评估奖励模型和LLM裁判的基准测试,帮助在大规模LLM训练和评估中复制人类偏好,包含真实的人类偏好数据和可验证的正确性偏好数据。