AI交流(进群备注:AlphaMaze-v0.2-1.5B)

AlphaMaze-v0.2-1.5B 是由 Jan team 开发的模型,专门用于解谜迷宫。该模型通过 SFT 微调和 GRPO 技术,使其具备了空间推理能力,尽管它是从 DeepSeek-R1 蒸馏出来的小模型。
AlphaMaze-v0.2-1.5B的特点:
- 1. 具备空间推理能力
- 2. 通过 SFT 微调技术优化
- 3. 应用了 GRPO 技术
- 4. 小模型但功能强大
AlphaMaze-v0.2-1.5B的功能:
- 1. 用于解谜迷宫
- 2. 在线演示迷宫解谜
- 3. 研究空间推理能力的应用
- 4. 教育和培训用途
相关导航

PolyMind开源项目 – 多模态LLM驱动的Web界面
PolyMind是一个多模态、函数调用驱动的LLM Web界面,专为与Mixtral 8x7B + TabbyAPI集成而设计,提供了广泛的功能。它支持使用DuckDuckGo进行互联网搜索和网页抓取,使用comfyui生成图像,通过sharegpt4v进行图像输入(通过llama.cpp的服务器),具备OCR和Yolo功能,支持使用nmap进行端口扫描,集成了Wolfram Alpha和Python解释器,并提供了用于PDF和杂文文本文件的语义搜索的RAG。90%的网页部分(HTML、JS、CSS和Flask)完全由Mixtral编写。
暂无评论...