Huggingface Diffusers的OneFlow移植版,比PyTorch版性能更高,支持多种扩散模型,易于集成与使用。
RectifiedFlow是一个简单统一的PyTorch代码库,专注于扩散和流模型,提供易于使用的平台用于训练和推理,强调简洁性、灵活性和快速原型设计。
集成了 TeaCache 的 ComfyUI 插件,用于加速图像、视频和音频扩散模型的推理过程,支持多种模型,并提供了简单的安装方法和推荐配置
Yachay AI是一个基于Byt5的地理标记模型,能够仅通过文本预测坐标。它为开发者提供了支持,以便构建和训练自己的模型,并在Github上提供相关资源和问答支持。
Lamini是一个为企业软件开发提供支持的AI驱动的LLM平台,通过生成性AI和机器学习,帮助开发者自动化工作流,简化软件开发过程,提高生产力。
将Andrej Karpathy的nanoGPT移植到Apple MLX框架,允许在苹果设备上训练OpenAI的GPT-2模型或自定义的GPT风格模型。该项目利用Apple MLX框架的优势,优化性能,简化模型训练流程,便于开发者在Apple生态中进行AI模型的开发和训练。
SEPIA 服务器支持通过WebSocket连接进行开源语音识别,易于自定义与扩展,兼容多种语音识别引擎。
getimg.ai是一个强大的AI图像生成工具套件,提供多种功能以创建和修改图像,包括从文本生成艺术图像、扩展图片以及创建个性化的AI模型。
利用该项目你可以在你的iOS或macOS应用程序中使用Stable Diffusion生成图像。
专为物理AI设计的世界基础模型平台,旨在帮助物理AI开发者更好更快地构建物理AI系统。
Neural Speech Synthesis是由Xu Tan和Hung-yi Lee在2022年Interspeech教程中介绍的一种先进的语音合成技术,利用深度学习算法生成自然流畅的语音,支持多种风格和情感,适用于多种应用场景。
Aviary允许在一个地方与各种大型语言模型(LLM)进行交互。用户可以直接比较不同模型的输出,按质量进行排名,并获得成本和延迟估计等功能。它特别支持在Hugging Face上托管的Transformer模型,并在许多情况下还支持DeepSpeed推理加速。