所有AI工具AI对话工具AI开源项目AI音频工具

Hibiki开源 – 实时流式语音翻译工具

Hibiki是由Kyutai Labs开发的实时流式语音翻译工具,旨在实现跨语言无缝交流。它支持边说边译,保留说话者音色,并适配多种设备。当前主要支持法语到英语的翻译,未来可能扩展到更...

标签:

Warning: Undefined variable $main_title in /www/wwwroot/msbd/wp-content/themes/onenav/sidebar-sitestop.php on line 26

AI交流(进群备注:)

Hibiki是由Kyutai Labs开发的实时流式语音翻译工具,旨在实现跨语言无缝交流。它支持边说边译,保留说话者音色,并适配多种设备。当前主要支持法语到英语的翻译,未来可能扩展到更多语言。

Hibiki的特点:

  • 1. 解码器-only模型,专为同时语音翻译设计
  • 2. 多流架构,生成文本和音频标记,频率为12.5Hz
  • 3. 支持语音转换,通过分类器-自由引导系数控制保真度
  • 4. 上下文大小为40秒,训练序列长达120秒
  • 5. Hibiki-M版本优化为移动设备,可在智能手机硬件上本地运行
  • 6. 支持法语到英语的实时翻译

Hibiki的功能:

  • 1. 跨语言实时会议翻译
  • 2. 移动设备上的即时语音翻译
  • 3. 保留说话者音色的语音转换
  • 4. 多平台支持(PyTorch、MLX、MLX-Swift、Rust)
  • 5. 开源模型,可通过Hugging Face访问

相关导航

暂无评论

暂无评论...