文小言是百度基於文心大模型開發的一款AI搜尋和創作助手,提供個性化搜尋結果、創作建議,並支持語音和圖片輸入。它被設計為滿足用戶日常需求的綜合AI助手,特別是在搜尋和內容創作方面表現突出。文小言的前身是百度的Ernie Bot,於2024年重新品牌化,增加了多模態搜尋功能,如文字轉圖片生成。
Coze on WeChat 是一个开源项目,旨在快速将 Coze Bot 接入到微信平台。该项目支持文本聊天、语音交互以及插件功能,并提供了一个 Web 后台管理界面,方便用户配置和管理机器人。通过 Coze on WeChat,用户可以轻松地将 Coze 平台上开发的 AI 机器人集成到微信中,实现与机器人的多种交互方式。
Ultravox 是一个开源的多模态实时语音模型,其语音理解性能接近 GPT-4o。它能够直接理解文本和人类语音,无需单独的自动语音识别(ASR)系统。目前支持文本输出,首次响应时间仅为 150 毫秒,生成速度约为 60 token/秒。基于 Llama3.1-8B 和 whisper 构建,通过多模态投影器直接将音频转换为高维空间,显著提升了响应速度。
Clean-Coder-AI是一个2合1的AI开发者和项目经理工具,旨在帮助用户轻松规划项目、编写代码、测试代码以及管理项目进度。它通过AI代理在Todoist中创建任务,像人类Scrum Master一样管理项目。此外,它还提供‘前端反馈’功能,使AI能够实时查看和优化它创建的前端界面,从而提升开发效率。该工具还支持语音交互,用户可以直接与AI对话,无需手动输入,极大地简化了项目管理流程。
ChatPilot是一款基于LangChain的智能对话助手,集成了Google搜索、文件网址对话(RAG)和代码解释器功能,复现了Kimi Chat的交互体验。支持OpenAI/Azure API,提供前后端分离的服务架构,前端使用Svelte,后端使用FastAPI。
Grok 3是由埃隆·马斯克旗下xAI公司发布的新一代人工智能大模型,被宣传为“地球上最聪明的人工智能”,是挑战OpenAI、DeepSeek等竞争对手的强力模型。
RAGDrive是一个无需代码的本地AI平台,提供语音交互和增强生成能力,适合所有用户。
Soul Tarot将人工智能与塔罗牌结合,帮助用户做出决策并洞察未来。用户可以提出问题、抽取塔罗牌,并获得个性化的解读。如有需要,还可以通过语音通话与AI塔罗指导进行进一步的交流。
这是一个第三方Alexa技能,通过说'Alexa, open ChatGPT'或'Alexa, ask ChatGPT how tall the Eiffel tower is'来启动。它允许用户进行长时间的对话,支持多种语言和声音,能够跨会话进行交互。
Interacly AI 是一个集成了 25 个以上领域的互动机器人平台,用户可以通过与机器人的对话来学习、发展和获取个性化的信息。它为好奇心提供了一个全新的伴侣,推动知识的未来。
Viva AI是一个个性化的人工智能助手,提供无缝的对话体验和珍贵的记忆。用户可以享受个性化的问候、流畅的语音互动,并随着每次聊天促进友谊的成长。
AIlice是一个轻量级的AI代理,旨在为开发者提供一个简单的开发框架,快速构建和测试各种AI智能体的想法,同时支持多模态交互和语音交互,为用户提供灵活的参与方式。
OmniSteward是一款基于人工智能的大型语言模型,能够通过语音或文字与用户进行互动,控制智能家居和电脑,具备高度的可扩展性和无限的应用可能性。
这是一个开源的macOS AI助手,结合视觉和语音技术,旨在提升用户的工作效率。
Kesha v3.0 是一个实验项目,结合了 Silero 的文本转语音、Vosk 的语音转文本、Picovoice Porcupine 的唤醒词检测和 ChatGPT 的智能对话功能,旨在提供自然流畅的语音交互体验。
ChatMirror是一款结合了人工智能技术的魔镜应用,旨在通过自然语言处理与用户进行互动,提供个性化的聊天体验。用户可以通过简单的语音或文本输入与它进行对话,获取信息、建议和娱乐。
Talk-to-ChatGPT是一个Google Chrome扩展,允许用户通过语音命令与ChatGPT AI互动,并接收语音回复。用户只需安装扩展并激活麦克风,就可以开始提问或与AI进行对话,同时通过文本转语音功能收听AI的回复。
Ultimate Toolbar Gpt- For ChatGpt是一个Chrome扩展,旨在为内容创作者、作家等用户提供快速访问高级ChatGpt功能和自动化工具的便捷方式。用户可以生成创意写作提示、创建基于语音的交互、以不同文件格式导出输出内容,并实现各种任务的自动化。
Khoj 是一款完美融合本地文档和在线搜索的 AI 第二大脑,旨在通过智能检索和对话,让你以更高效的方式管理和利用自己的知识和信息。它支持多种文件格式,能够连接个人知识库,提供强大的搜索引擎,适用于多种平台,并且是完全开源的。
将ChatGPT接入亚马逊的智能音箱Alexa的开源项目,允许用户通过语音与ChatGPT进行交互。该项目支持语音输入与输出,并需要用户提供OpenAPI的API Key,用户可以自定义对话设置以满足不同需求。