Warning: Undefined variable $main_title in /www/wwwroot/msbd/wp-content/themes/onenav/sidebar-sitestop.php on line 26
AI交流(进群备注:)

Huginn 是一种新型语言模型架构,基于循环深度设计,允许在测试时扩展计算量,而无需增加模型参数或上下文窗口长度。该模型通过在连续潜在空间中迭代循环进行隐式推理,从而提升语言模型在推理任务上的表现。Huginn 的训练数据达 8000 亿个标记,涵盖代码、数学、科学文本和通用文本等多种类型,并提供 35 亿参数的版本,适合在普通硬件上部署。
Huginn的特点:
- 1. 通过循环深度扩展测试时计算量,提升推理能力
- 2. 无需增加模型参数或上下文窗口长度
- 3. 在连续潜在空间中通过迭代循环进行隐式推理
- 4. 支持自适应计算,优化资源使用
- 5. 零样本任务处理,无需特定训练数据
Huginn的功能:
- 1. 使用 PyTorch 加载模型,设置循环深度进行推理
- 2. 支持多种基准测试,如 ARC、HellaSwag、MMLU 等
- 3. 应用于科学、数学和编码相关问题的推理任务
- 4. 在资源受限的环境下进行本地部署
- 5. 通过聊天模板进行对话交互
相关导航
暂无评论...