Nanospeech 是一个基于 PyTorch 和 MLX 的研究导向型文本转语音(TTS)系统,具有模型小巧(82M参数)、训练高效(单卡H100几天完成)和生成速度快(3-5倍实时)的特点。支持语音匹配功能,提供多种内置语音选项,并兼容多GPU训练和流式数据加载。
Lightning Whisper MLX 是一个专为 Apple Silicon 优化的 Whisper 实现,使用 MLX 框架,显著提升了 Whisper 任务的速度,比其他实现快 10 倍,比当前 MLX 实现快 4 倍。
mlx-audio 是一个基于 Apple 的 MLX 框架构建的文本转语音 (TTS) 和语音转语音 (STS) 库,专为 Apple Silicon 设备优化,提供高效的语音合成功能。它支持多语言、语音自定义和量化技术,适用于需要高性能语音合成的应用场景。
该项目允许用户在本地记录并支持搜索他们在Apple Silicon设备上查看的所有内容,提供高效的数据管理和用户友好的界面。
一款基于苹果MLX框架的本地推理服务器,专为Apple Silicon芯片优化设计。支持OpenAI兼容的API接口,实现文本对话、语音转换、图像生成等AI能力。
LLaMA_MPS是一个专门为Apple Silicon GPU优化的项目,旨在高效地运行LLaMA模型的推理过程。该项目充分利用苹果硬件的加速能力,提供简洁的API接口,优化内存管理,确保用户能够快速高效地进行自然语言处理任务。
Amazing AI 是一款专为 Apple Silicon(M1/M2)开发的图像生成软件,利用稳定扩散技术,根据文本描述生成详细的图片。该应用经过优化,借助 Apple Neural Engine 提供更快、更省电的性能,同时拥有原生用户界面和更高的安全性。
Catbird.ai 是一个多模型图像生成工具,允许用户通过单一提示同时从多个AI模型生成图像,提供丰富的输出选项,适用于各种用途。
Mini Dalle 3 Online是一个先进的AI系统,能够将详细的文本描述转化为高度逼真和细致的图像。用户只需提供详细的文本描述,系统就会生成相应的图像,广泛应用于平面设计、插图、广告和内容创作等领域。
Flux Image Generator 是一款前沿的人工智能工具,能够将文本描述转化为高质量的图像。该平台在提示准确性和生成高品质视觉效果方面表现出色,适用于各种创意和设计需求。
Tome是一个新型的平台,帮助用户通过AI生成内容和图像,创建演示文稿、落地页等,提供现代交流所需的灵活多媒体画布。用户只需输入想法和提示,AI工具将为其提供建议和选项,以有效表达他们的思想。Tome支持生成各种材料,如单页文档、演示文稿、情绪板等,同时还提供改善写作语气和措辞的功能,创建引人注目的图像,并搜索参考资料。用户可以轻松将现有作品粘贴到平台中,Tome会自动生成叙述和匹配的图像。通过互动嵌入和沉浸式查看选项,用户能够生动地呈现他们的想法并轻松分享给他人。
一个用于文本到语音生成的Web用户界面,支持多种语音合成模型,用户可以轻松创建高质量的语音合成音频。
创建AI自己的照片。生成30张自己的照片,使用我们最好的艺术风格。
AISixteen Studio是一个AI驱动的图像生成器,用户可以通过文本输入生成图像,适用于网站横幅、社交媒体图形、产品照片和数字艺术等多种需求。
Re.Art是一个强大的AI图像生成器,能够基于用户输入的提示生成高质量的图像,采用先进的Stable Diffusion技术,确保生成的图像视觉效果出众,满足专业标准。
Promptist是一个为Stable Diffusion v1-4设计的提示接口,能够优化用户输入,使其更符合模型的偏好,从而提高生成效果。
Alchemi是一个由AI驱动的平台,旨在自动化内容创作、优化SEO和简化工作流程,提供高质量、符合SEO标准的内容,保持品牌一致性。
AI-SEO官方Chrome扩展允许用户复制和粘贴使用AI-SEO生成或归档的文章,方便用户高效管理和利用AI生成的内容。