Kokoro 82M官网 – 高质量的文本转语音模型

Kokoro 82M 是一个高质量的 TTS 模型，能够生成极高音频质量的语音，同时模型大小不到 300M，便于部署和使用。该模型在 T4 上能够快速生成语音，并支持通过架构训练其他语言，且只需不到 100 小时的音频数据进行训练。
Kokoro 82M的特点:
1. 生成音频质量高
2. 模型大小小于 300M
3. 在 T4 上快速生成语音
4. 支持通过架构训练其他语言
5. 仅需不到 100 小时的音频数据进行训练

Kokoro 82M的功能:
1. 生成英文语音
2. 训练其他语言的 TTS 模型
3. 进行语音合成和文本转语音的应用
4. 在 Hugging Face 平台上进行模型演示

相关导航

GPT-SoVITS开源项目 – 中文语音克隆，1分钟可训练TTS模型

GPT-SoVITS 是一个适用于中文的语音克隆项目，能够通过短时间的语音数据训练出高质量的文本到语音（TTS）模型。仅需1分钟的语音数据即可进行有效的模型微调，支持多语言推理，并提供易于使用的Web界面，适合初学者创建和管理训练数据集。

Moshi开源项目 – 实时对话的语音文本基础模型

Moshi是一个实时对话的语音文本基础模型，使用先进的流式神经音频编解码器Mimi，支持双向语音流处理，具有低延迟和高效率的特点。

hf-chat开源项目 – 高效的本地聊天应用

使用 huggingface/chat-ui 和 huggingface/candle 创建的适用于 macOS 和 iOS 的本地高效的聊天应用程序，提供流畅的用户体验和强大的聊天功能。

Melobytes.com官网 – AI创意工具平台

Melobytes.com是一个在线平台，提供多种AI驱动的创意工具，帮助用户探索艺术、音乐等领域的边界。通过简单易用的应用程序，用户可以为自己和朋友创造独特有趣的内容，可能性无穷无尽！

Ai Listify官网 – 优质AI工具的汇总平台

Ai Listify 是一个顶级的人工智能资源目录，汇集了前沿的AI工具。通过精心挑选的工具，用户可以释放创新的力量，探索、学习并提升自己的AI技能。

Speechki官网 – AI真实语音生成器

Speechki是一个AI驱动的语音生成和文本转语音解决方案，用户可以通过它将任何文本转换为高质量的音频内容，支持1100多种声音和80多种语言。

free text Into Speech官网 – 将文本转换为语音

这是一个在线文本转语音服务，用户可以输入文本并选择喜欢的声音进行转换。适用于创建有声书、帮助视障人士、语言学习和提升网站及应用的可访问性。

Flux开源项目 – 生成高质量图像的先进项目

Flux是由Stability AI原来Stable diffusion的创始成员打造的生成图像项目，生成图像的质量与midjourney不相上下，甚至更好！

SoundHound官网 – 一个为语音驱动的世界提供对话智能解决方案的平台

SoundHound是一个语音AI平台，提供语音驱动设备、服务、车辆和移动应用的对话智能解决方案。它可以集成到各个行业和用例中，帮助用户构建自己的语音助手，访问内容领域。

Clone Anyone’s voice in seconds with AI官网 – 快速克隆任何人的声音

CloneMyVoice.io是一个基于AI技术的服务，能够高保真地克隆用户自己的声音或任何其他声音，支持非英语使用者模拟母语英语发音，并提供低成本的企业级声音克隆服务，训练数据基于30万小时的音频。

MLX Engine开源项目 – 利用硬件加速的开源语言模型引擎

MLX Engine是一个开源项目，旨在利用Apple M系列芯片的硬件加速能力，以超快的速度和100%本地、离线的方式运行大型语言模型（LLM）。它能够在M3芯片上以约250 tok/秒的速度运行Llama 3.2 1B模型，始终以结构化JSON格式输出，支持通过代码或Chat UI与模型进行交互，并能同时运行多个模型，用户还可以从Hugging Face下载任何模型。

Leelo-ai官网 – AI驱动的高质量文本转语音工具

Leelo是一款专为企业设计的AI驱动文本转语音工具，能够将文本转换为自然流畅的音频，帮助企业提升内容传播效果。

Hugging Face Deep Learning Containers for Google Cloud开源项目 – 用于Google Cloud的深度学习容器

一套用于在Google Cloud Vertex AI和Google Kubernetes Engine上训练和部署模型的Docker镜像

LLaMA-O1开源项目 – 大型推理模型框架

LLaMA-O1 是一个大型推理模型框架，专为 PyTorch 和 HuggingFace 设计，支持训练、推理和评估。它集成了蒙特卡洛树搜索（MCTS）、自我对弈强化学习、PPO 和类似 AlphaGo Zero 的双策略范式，适用于大型语言模型的开发和应用。

KernelBench开源项目 – 高效GPU内核生成与评估工具

KernelBench 是一个专注于使用大模型生成高效GPU内核的项目，旨在通过编写自定义内核来替代PyTorch中的标准实现，并评估其正确性和性能提升。该项目包含250个神经网络任务，涵盖基础Kernel操作、简单的fusion pattern和完整的神经网络结构。同时，KernelBench 还提供四个级别的测试类别，包括单内核运算符、简单融合模式、完整模型架构和HuggingFace模型优化，以测试LLM将PyTorch算子转译为CUDA内核的能力，并评估生成代码的编译、正确性和性能。

暂无评论

暂无评论...