一个可定制、简洁、用户友好且高效的工具包,用于训练和微调大型语言模型,支持多种训练和优化方法,以提高模型性能和稳定性。
2000 Fine Tuning Prompts是一个全面的资源,旨在帮助爱好者学习和实验微调,熟悉其在不同上下文中的功能和应用。
基于LLaMA和SlimPajama的MoE模型,旨在利用混合专家模型进行持续预训练。该模型结合了LLaMA和SlimPajama的优点,通过支持混合专家架构,提高模型的效率和性能,同时能够进行持续的预训练,以适应不同的任务,灵活的模型配置使其适用于多种应用场景。
Delta是一个用Rust语言开发的开源机器学习框架,包含神经网络层、激活函数、损失函数、优化器等组件,并提供数据处理工具。
MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队提供。它提供了熟悉的 API 和强大的功能,支持多种计算模式和设备,旨在简化机器学习模型的构建与训练。
VideoTuna是一个集成了多种视频生成模型的代码库,支持从文本到视频、图像到视频的生成,并提供了预训练、连续训练、对齐和微调等完整的视频生成流程。它支持多种视频生成模型,如CogVideoX、Open-Sora、VideoCrafter等,能够处理不同分辨率的生成任务。此外,VideoTuna还提供了丰富的后处理功能,如视频到视频的后处理和增强模块,并计划推出3D视频VAE和可控面部视频生成模型,进一步扩展应用场景。
Vercel AI Playground是一个在线平台,允许用户使用最新的AI语言模型构建AI驱动的应用程序。它提供了一系列功能来微调模型,例如并排比较模型的Compare Mode和优化参数的Tweak Mode。
一个开源软件,旨在实现照片和视频中的一键换脸功能,基于深度学习技术,支持实时处理和多种文件格式,无需训练数据,用户友好。
LexiGym是一个词汇训练应用程序,支持字典GPT,结合了Google Sheets集成,提供个性化词典和离线学习功能。它为所有语言学习者提供了一种有效且动态的学习方式。用户可以创建或加载字典,选择训练类型,并跟踪学习进度。
Okrolearn是一个由Okerew创建的机器学习库,旨在简化机器学习模型的构建和训练过程。它提供了一系列工具和功能,帮助开发者快速实现和优化机器学习算法,适用于研究和实际应用。
Ollama是一个能创建、运行和共享自包含大型语言模型(LLM)的工具,将模型的权重、配置、提示等打包成自包含的文件,可以在任何地方运行。
LOMO是复旦大学提出的新论文,旨在使用单台8片24G的RTX 3090对Llama 65B模型进行全参数微调。该项目通过优化训练效率和性能,为用户提供了兼容多种深度学习框架的解决方案,并附带详细的实验结果和分析,帮助用户更好地理解模型的表现。
Magi是一个基于JAX的强化学习库,支持多种算法并提供灵活的环境接口,易于扩展和自定义,集成了评估和可视化工具。
这是一个完整的管道,用于在消费硬件上使用LoRA和RLHF微调Alpaca LLM。基于Alpaca架构实现人类反馈的强化学习(RLHF),基本上是ChatGPT的一个变体,但使用的是Alpaca。
DesignRoasts 是一个帮助用户通过提供洞察来提升访客转化率、增加销售和促进增长的工具。用户只需上传截图即可开始使用,适用于各种优化场景。
gemma-cookbook是一个关于谷歌Gemma模型的全面指南,提供详细的使用说明和多种示例,帮助用户快速上手、训练和评估模型,同时包含最佳实践和优化建议,易于集成到现有的机器学习工作流中。