集成了多模态动作模型的智能系统,通过思维链和前瞻性空间推理来执行具体动作,让机器人更智能地理解和完成任务
SPIN是一个先进的机器人系统,能够在复杂环境中进行实时感知、交互和导航。它结合了多种技术,如动态避障、物体识别和主动视觉,允许机器人在无需预先创建环境地图的情况下高效地移动和操作。
MuJoCo系统辨识助手是一个专注于已知模型结构的机械系统的实用工具,利用Levenberg-Marquardt非线性最小二乘法等先进技术,帮助用户高效估计结构化模型中的参数,从而简化机器人系统的辨识过程。
这个项目可以让用户与大语言模型进行自然的语音对话,结合先进的语音转录和文本到语音技术,提供流畅的交互体验。
SimVG是一个旨在通过解耦的多模态融合技术实现视觉定位的简单框架。该项目支持与视觉语言模型集成,增强视觉定位任务的能力。
这是一个关于人与物体物理交互的数据集,记录了人推、拉、搬不同阻力物体的动作,帮助研究者更好地理解人与物体之间的物理动态
开源中英双语对话模型 ChatGLM-6B 的第二代版本,拥有更强大的性能、更长的上下文、更高效的推理和更开放的协议。
Hertz-dev是一个开源的基础模型,专门用于全双工生成会话性音频,使设备能够理解和参与对话,适用于各种设备,具有良好的扩展性和灵活性。
iX 是一个自主的GPT-4智能体平台,旨在设计和部署半自主LLM智能体,提供了一种可扩展和响应迅速的解决方案,用于将任务委派给AI驱动的智能体。
Sage是一个强大的AI平台,旨在帮助用户通过虚拟助手进行互动,轻松生成代码,以及创建令人惊叹的图像、视频或音频。它不断更新,未来将推出激动人心的翻译功能,致力于将用户的想象力与尖端AI技术结合。
mink是一个基于MuJoCo的Python逆向运动学库,旨在为多种机器人提供高效的差分逆向运动学解决方案。该库使得机器人在复杂环境中的运动规划和控制变得更加简便,适合研究和应用于多种机器人平台。
项目的目标是创造一个能自主学习和自我决策的人工智能系统,通过给AI提供合适的工具,让它能实时进化和学习新的能力,这样的AI系统有望成为通用人工智能。
该项目专注于开发持续的场景表示,以增强具身AI系统的能力,支持实时场景理解和动态环境中的导航与交互。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型