Ovis-2是一个视觉大模型,具备强大的图像和视频识别能力,尤其在OCR方面表现卓越。虽然其推理能力目前定位为辅助识别,但建议在实际使用中结合其他推理能力更强的大模型,以实现更全面的功能。
一组优化性能的先进机器学习模型,可在高通®设备上部署,涵盖视觉、语音、文本和生成式 AI 等领域。
WriteSmith是一款结合了GPT-4、视觉识别和DALL-E-3的AI助手,能够通过摄像头观察世界,生成聊天中的图像,并记住用户的对话内容,以便深入探讨话题。由独立开发者打造,旨在帮助用户解决视觉问题、回答物体相关问题,带来有趣的AI体验。
MiniCPM-o 是一款轻量级多模态大语言模型,具有8B参数,能够在手机、iPad等终端设备上高效运行。它支持视觉、语音和多模态实时流媒体处理,性能达到GPT-4o水平。MiniCPM-o 具备领先的视觉能力、创新的语音交互功能,支持多语言和多模态实时流媒体处理,广泛应用于实时语音对话、OCR、视频理解、多语言支持等场景。
Browser Use 是一个开源工具,旨在让 AI 智能体能够自动化操作浏览器,像真人一样理解网页内容并完成各种复杂的操作任务。它支持视觉识别、HTML 元素解析、自动管理多个标签页、自定义操作、并行多个智能体,并兼容主流模型如 GPT-4o 和 Claude 3.5 Sonnet。通过简单的 Python 代码,用户可以快速将 AI 代理与浏览器连接,实现网页访问、数据抓取、表单填写等自动化任务。
GPT-4V浏览器机器人,能够在浏览器中进行视觉识别、控制、导航和执行各种在线任务,提升用户的浏览体验和任务效率。
这是一个开源的macOS AI助手,结合视觉和语音技术,旨在提升用户的工作效率。
vimGPT利用GPT-4V的视觉识别能力和Vimium扩展,在Chrome浏览器中通过简单实用的方式实现网页浏览,提升用户体验。
Lucy是一个为影院定制的AI助手,能够进行聊天、视觉识别、销售并在多个平台上维护对话,提供创新的解决方案。
Betii AI 是一款为 Shopify 商店设计的人工智能支持电话接待员,能够全天候自动将访客转化为买家及回头客。通过简单的设置,用户可以配置接待员的声音和个人资料,购买电话号码并与 Shopify 集成,从而自动化客户互动。
Klu.ai是一个完整的LLM平台,提供设计、部署和优化生成式AI应用所需的一切。它支持与多种主要LLM(如Claude 2、GPT-4、Llama 2等)的连接和原型制作,帮助用户观察使用情况、收集反馈并微调模型。AI工程师和产品经理都能享受我们端到端的平台和无代码工具。
RealFeedback是一个基于ChatGPT的聊天机器人,旨在通过对话方式收集用户反馈。它可以轻松嵌入网站,通过聊天气泡的形式展现,为网站所有者提供基于用户互动的有用见解。
WriteCap是一个帮助生成个性化社交媒体标题的网站。用户只需回答一些与帖子相关的问题,WriteCap便会为其创建独特且个性化的标题,助力社交媒体的提升与互动。
AI Labs是一个致力于女性健康管理的工具,帮助用户轻松了解尿路感染、PCOS/PCOD及月经健康。目前仍处于测试阶段,旨在不断改进以提供更好的服务。
BluChatbot 是一个基于 AI 的多通道客服系统,支持 WhatsApp、Telegram 和 Facebook Messenger,旨在提升客户体验并简化客户互动。
AlTable.ai是一个平台,用户只需点击一下即可轻松将表格转换为AI驱动的聊天机器人。只需上传表格数据,选择所需的聊天机器人功能,然后点击按钮即可生成AI聊天机器人。
Threado AI是一款强大的AI驱动支持助手,能够根据您的知识库、过去的解决方案、工作区和社区对话进行训练,提供快速而精准的客户支持,提升客户满意度。
Verbatik是一个AI驱动的文本转语音平台,支持超过142种语言和口音,将文本转换为自然流畅的语音。用户可以选择多种逼真的AI语音,轻松创建高质量的配音,适用于多种场景。