EdgeVLA开源项目 – 用于机器人视觉理解的开源模型

EdgeVLA是一个开源的边缘视觉-语言-行动模型，旨在增强机器人对视觉信息的理解和执行指令的能力。该项目专为边缘计算环境设计，支持社区贡献和改进。
EdgeVLA的特点:
1. 增强机器人的视觉理解能力
2. 基于视觉-语言交互执行指令的能力
3. 开源，支持社区贡献和改进
4. 专为边缘计算环境设计

EdgeVLA的功能:
1. 与机器人系统集成，提升其与视觉环境的互动
2. 用于训练需要理解语言和视觉输入的模型
3. 在边缘设备中部署，实现实时处理和决策

相关导航

Juice官网 – GPU资源的虚拟远程访问

Juice是一个软件项目，提供GPU-over-IP解决方案，使用户能够远程访问和共享可负担且易于获取的GPU资源。通过利用未使用的GPU容量（称为'Dark GPU'），Juice可以在不同的部署和提供商之间实现GPU的高效利用。用户只需在工作站或服务器上安装该软件，即可实现对GPU加速工作负载的直接远程访问。

爱丽丝在可微仙境的冒险-神经网络入门书籍，以爱丽丝探险为比喻

以爱丽丝漫游“可微分”仙境为比喻，向读者介绍神经网络领域的入门书，涵盖自动微分优化函数、序列、图、文本和音频处理的设计技术。

esp32-llm开源项目 – 在ESP32上运行大型语言模型

在ESP32微控制器上运行大型语言模型（LLM），探索其在资源受限环境下的可能性，特色包括使用tinyllamas模型和对llama.2c的优化以提高性能。

Enclave AI官网 – 一款私密的人工智能助手

Enclave AI 是一款私密的人工智能助手，使用开源模型并直接在用户设备上运行。用户的使用过程完全匿名，数据不会离开设备。我们不追踪用户凭证或监控应用内的任何活动，确保隐私得到保障。

Llama 3.1官网 – 官方量化版本，速度快内存小

Meta 发布的 Llama 3.1 1B和3B的官方量化版本，提供了更小的内存占用、更快的设备推理速度、准确性和便携性。

PaliGemma 2 Mix开源项目 – 多任务视觉语言模型

谷歌DeepMind发布的最新多任务视觉语言模型(VLM)，集成了多种视觉和语言处理能力，支持图像描述、目标检测、图像分割、OCR以及文档理解等任务。该模型提供三种不同参数规模(3B、10B、28B)，支持224px和448px两种分辨率，基于开源框架开发，易于使用和扩展，通过简单提示即可切换任务，无需额外加载模型。

Chinese Llama 2 7b开源项目 – 国内首个开源的中文LLaMA2模型

这是国内第一个真正的开源、可下载、可运行的 LLaMA2 模型，提供中文版 Llama2模型及中英文 SFT 数据集，兼容适配所有针对原版 llama-2-chat 模型的优化。

VT-Transformer开源项目 – AI模型转换器，优化硬件性能

VT-Transformer是一个基于第一性原理的AI模型转换器，采用宏展开的DSL技术，旨在优化各种AI模型在复杂硬件环境下的性能，特别是针对国产硬件。

vicuna-33b官网 – 开源但不可商用的最高模型

vicuna-33b是最新发布的高性能开源模型，尽管开源，但不允许商用，适用于各种自然语言处理任务。

Qwen-Agent开源项目 – 基于Qwen的智能代理框架

Qwen-Agent是阿里开源的一个基于Qwen2.0的智能代理框架，具备指令遵循、工具使用、任务规划和记忆能力，可用于构建各种能执行复杂任务的AI代理。开发者可基于此框架开发Agent应用，充分利用Qwen模型的强大功能，如处理长文档、支持多种工具使用、实现复杂任务规划等。项目还提供了浏览器助手、代码解释器、自定义助手等示例应用，帮助开发者快速上手和部署复杂的AI代理应用。

XVERSE-65B开源项目 – 支持多语言的650亿参数大模型

VERSE-65B 是由深圳元象科技自主研发的支持多语言的大语言模型，参数规模为 650 亿，开源的底座模型。

Qwen开源项目 – 多语言处理开源框架

Qwen是阿里通义千问开源的多语言处理框架，支持多种自然语言处理任务，提供高效的模型推理和友好的用户接口。它兼容多种开发环境，旨在为开发者提供高效构建语言模型的工具，支持广泛的语言覆盖与任务适配，帮助解决全球化场景下的文本处理需求。最新的720亿参数版Qwen-72B和Qwen-72B-Chat在多个任务上超越LLaMA2-70B和GPT系列模型。

Stable Diffusion 3.5官网 – 开源文本生成图像模型

Stable Diffusion 3.5 是由 Stability AI 发布的开源文本生成图像模型系列，包括多个变体如 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Medium。这些模型基于多模态扩散变换器（MMDiT）架构，旨在生成高质量图像，特别适用于文本提示生成图像的任务。项目强调其高度可定制性，适合在消费级硬件上运行，且在 Stability AI 社区许可下免费使用。该许可允许非商业用途免费，以及商业用途年收入低于 100 万美元的组织或个人免费使用，高于此需联系企业许可。用户对生成图像拥有所有权，无需担心许可限制。

mllm开源项目 – 移动设备上的多模态语言模型推理引擎

mllm是一个专为移动和边缘设备优化的轻量级多模态大型语言模型推理引擎，能够在无需依赖外部库的情况下，支持多种模型和硬件架构，提供快速推理能力。

k3s-root开源项目 – 轻量级的 Kubernetes 解决方案

k3s-root 是 k3s 项目的核心组件，提供轻量级的 Kubernetes 解决方案，旨在简化容器管理和部署。

TeleChat2开源项目 – 首个完全国产的千亿参数大语言模型

星辰语义大模型TeleChat2是由中国电信人工智能研究院研发训练的大语言模型，是首个完全国产算力训练并开源的千亿参数模型，包含大约1150亿个参数。

360 智脑官网 – 多模态生成AI大模型

360 智脑是由奇虎 360 公司独立开发的 AI 大模型，拥有数百亿参数规模和多模态生成能力。它支持文本生成、图像生成、文本到视频转换等功能，涵盖生成创作、多轮对话、逻辑推理等十大核心能力，旨在为用户提供强大的 AI 辅助工具。其训练基于 3.4 万亿 token 的语料库，支持多达 360K 的上下文长度，适用于复杂的 AI 交互场景。

暂无评论

暂无评论...