anira是一个实时音频应用中的神经网络推理架构,旨在为音频应用提供高性能的神经网络集成方案,确保实时安全性和高效的并行推理。
Typeframes 是一款视频制作工具,专为希望吸引注意力并发展业务的创作者而设计。它通过 AI 技术将文本转化为高质量视频,简化了社交媒体视频制作的过程,特别适合 YouTube、Instagram 和 TikTok 平台。用户可以自定义视频内容、颜色、字体和布局,同时支持音频集成,帮助用户快速制作出吸引人的视频。
S.A.T.U.R.D.A.Y是一个用于处理WebRTC、音频和AI的工具箱,基于Pion、whisper.cpp和Coqui TTS构建。
Speechki是一个AI驱动的语音生成和文本转语音解决方案,用户可以通过它将任何文本转换为高质量的音频内容,支持1100多种声音和80多种语言。
由transformers.js提供支持的浏览器里100%客户端运行的实时音频转录,支持多种语言,易于集成到网页应用中。
Melodisco是一个人工智能音乐播放器与生成器,用户可以探索AI生成的旋律,并创建自己的AI歌曲。该项目结合了先进的AI技术,为音乐创作提供了全新的体验和灵感。
音频领域的大型语言模型集合,专注于音频处理、理解和生成,为音频语言模型提供丰富的资源和工具