open-instruct 是一个开源项目,专注于指令微调和后训练大型语言模型。它提供了最新的技术和指令数据集,支持直接偏好优化(DPO)和可验证奖励强化学习(RLVR),并在各种基准上评估模型性能。该项目为研究人员和开发者提供了一个平台,用于探索和改进指令微调技术。
MLX-VLM 是一个专为在 Mac 上进行视觉语言模型(VLM)推理和微调而设计的 Python 包。它利用 MLX 框架,针对苹果芯片进行了优化,支持多种 VLM 模型,如 Qwen2-VL、Idefics 和 LLaVA 等。项目提供了多模态输入和微调能力,支持图像、视频和文本的组合输入,并提供了 LoRA 和 QLoRA 微调方法。
Fine-tune Phi-2是一个用于对Phi-2模型进行微调的项目,包含使用QLoRA技术进行微调、创建合成对话数据集以及支持多个GPU并行训练的功能。该项目提供了详细的示例代码和文档,允许用户灵活配置训练参数,以便优化模型的表现。
该项目基于 QLoRA 技术对 Falcon-7B 大型语言模型进行微调,专注于心理健康领域的对话数据集,从而提升模型在特定领域的性能。该模型支持多种对话场景的处理,旨在为心理健康相关应用提供更优质的支持。
Quokka是一个利用大型语言模型提供即时个性化微治疗的AI心理健康应用,旨在促进用户的幸福感并支持他们的心理健康之旅。
该项目旨在使用Rust语言在CPU上运行大型语言模型的推理。它不仅实现了快速的推理速度,还能在低能耗的情况下提供高效的性能。适用于本地推理和Rust项目集成,适合研究新语言模型应用。
《对齐手册》主题是如何使用不同技术来微调语言模型,以使其更符合人类和AI的偏好。
WizardLM是一个基于Code Llama微调的模型,专注于代码生成和相关任务,支持多种编程语言的代码编写与理解,提供模型的测试地址和下载链接,经过简单测试表现良好。
NeMo-Skills是一个专注于提升大型语言模型在数学问题解决能力的项目,同时支持多种任务的优化和改进,利用深度学习技术增强模型表现,且为开源项目,便于社区贡献和扩展。
Emotion是一个帮助用户识别意外情绪波动、情绪剧烈变化和低能量等原因的网站,只需1分钟即可完成。用户只需回答几个关于日常生活、睡眠模式和近期经历的问题,网站便会根据反馈提供可能导致情绪变化的因素洞察。