OSUM是西北工业大学开源的一个语音理解模型,支持8种语音理解任务,涵盖从语音识别到情感识别,以及语音到文本的深度理解。它结合了Whisper和Qwen2,采用ASR+X训练策略,支持多任务同时训练优化,适用于多种语音处理场景。
EmoNet是一款结合文本、语音和图像的多模态情感分析模型,能够识别人类的情绪状态。它通过深度学习技术,将语音语调、面部表情和文本内容综合分析,提升情感识别的准确率。EmoNet适用于客户服务、心理健康监测、人机交互等场景,让AI更具人性化。
Friend是一个创新的AI驱动工具,旨在彻底改变个人和职业互动。它通过提供虚拟伴侣来简化和增强沟通,帮助用户进行各种任务,从日程安排到情感支持。无论您是希望简化工作流程的忙碌专业人士,还是寻找更个性化数字助手的人,Friend都提供多种功能来满足您的需求。
Spirit LM是一个端到端的语音模型,提供基础版和高表现力版,能够进行高效的语音识别和生成,支持直接使用语音标记等多种特性,适用于复杂任务的处理。
Speechllect是一个基于AI的解决方案,提供实时的语音转文本和文本转语音功能,利用SenseTheory数学理论分析用户发音的每个单词的意义,从而实现准确且具有上下文意义的转换。
MyVocal Voice Synthesizer 是一个先进的声学技术平台,提供即时声音克隆、情感识别及多种声音应用功能,帮助用户创建个性化的声音体验。
Dore AI是一个基于AI的移动SDK,适用于iOS和Android开发者,允许他们为移动应用赋予思考和视觉能力。开发者可以通过简单的代码集成SDK,选择适合自己项目的模块。
PhotoFairy是一款用户友好的在线照片编辑和图形设计工具,利用无限画布的理念,为用户提供强大的编辑功能,适合新手和专业设计师。
Cutout.Pro是一个专注于AI照片和视频编辑工具的视觉设计平台,提供自动化的背景去除、图像修复、图形设计和内容生成服务。用户只需上传图像或视频,选择所需的编辑工具,AI算法将自动处理内容并根据用户的偏好进行优化。
BeautyPlus是一款功能丰富的照片和视频编辑工具,提供多种编辑工具和免费内容,旨在让用户轻松编辑和分享生活中的精彩瞬间。用户可以通过访问网站,探索各种可用功能,从而实现创意。
FigureToCartoon是一个在线工具,可以将您的照片即时转换为漫画、3D、素描、艺术或自由手风格的卡通图像。只需上传想要的照片,选择所需的卡通风格,点击转换按钮,几秒钟内即可获得独特的卡通版本。
Hume AI是一个先进的平台,通过将情感智能整合到AI技术中,增强人机互动,旨在实现更自然和富有同情心的用户与系统之间的沟通,惠及开发者、研究人员和企业。
Picstudio是一个面向Android的全能AI照片编辑器,提供AI头像、免费背景移除、卡通滤镜、图像增强和黑白图像上色等功能,未来将添加更多AI头像样式和工具。
roboMUA是一个在线平台,利用人工智能化妆师提供虚拟化妆服务。用户只需上传照片,AI化妆师会分析面部特征,允许用户虚拟尝试不同的化妆造型和风格。
sherpa 是一个针对 llama.cpp 模型的演示应用,专为移动设备设计,提供高效的模型推理和用户友好的界面。
OneImg是一个利用AI技术的免费在线照片编辑平台,用户只需简单点击即可增强和优化照片。它提供了一系列功能,包括照片增强、旧照片修复、背景去除、颜色校正等。用户可以通过访问网站上传照片,选择所需功能进行编辑,最后下载编辑后的照片。
Art Filter for Camera是一款应用,通过稳定扩散滤镜让用户在实时环境中体验著名艺术家如梵高的独特艺术风格。用户可以选择艺术家的视角,拍摄照片或录制视频,提升摄影技巧,沉浸于艺术世界,创造独特内容。
Face26是一款创新的AI驱动照片增强器,旨在为旧照片、模糊图像或低质量照片注入新生命。它提供了多种工具,可以满足各种照片增强需求,如去模糊、为黑白照片上色、恢复老旧快照和为静态肖像动画化。用户界面友好,并结合强大的AI算法,Face26承诺将彻底改变我们与照片的互动方式。