目标预训练

Pre-Training Goal-based Models for Sample-Efficient Reinforcement Learning开源项目 – 通过目标预训练提升样本效率

Pre-Training Goal-based Models for Sample-Efficient Reinforcement Learning开源项目 – 通过目标预训练提升样本效率

一种通过基于目标的预训练方法来提高强化学习中的样本效率。

强化学习代理训练样本效率强化学习目标预训练

Pre-Training Goal-based Models for Sample-Efficient Reinforcement Learning开源项目 – 通过目标预训练提升样本效率

Pre-Training Goal-based Models for Sample-Efficient Reinforcement Learning开源项目 – 通过目标预训练提升样本效率

一种通过基于目标的预训练方法来提高强化学习中的样本效率。

强化学习代理训练样本效率强化学习目标预训练

AnySkill开源项目 – 学习开放词汇的物理技能

AnySkill开源项目 – 学习开放词汇的物理技能

AnySkill是一个用于交互代理的开放词汇物理技能学习项目，旨在提升交互代理在多种物理技能上的学习能力。该项目通过创新的方法使代理能够在未见过的技能上进行学习，进而实现更灵活的交互和应用。

交互代理训练开放词汇技能物理技能学习

Mixture-of-Experts Meets Instruction Tuning-提高语言模型的调优效率

一种特殊的神经网络架构，可以在不增加推理成本的情况下，为语言大模型（LLM）增加可学习的参数。该研究发现模型比密集模型更能从指令调优中获益，因此提出将MoE和指令调优结合起来。

Mixture-of-Experts指令调优语言模型性能提升高效模型训练

GameNGen开源项目 – 由神经网络驱动的高质量游戏引擎

Google 推出的 GameNGen，是第一款完全由神经网络模型驱动的游戏引擎，它能够以高质量方式在长轨迹上与复杂环境进行实时交互。

实时游戏模拟强化学习代理训练神经网络游戏引擎

YaRN开源项目 – 高效的上下文窗口扩展工具

YaRN开源项目 – 高效的上下文窗口扩展工具

YaRN是一个高效的上下文窗口扩展工具，旨在提高大型语言模型的上下文处理能力。

上下文窗口扩展工具大型语言模型模型推理训练效率提升

Stick-breaking Attention开源项目 – 提高GPU上变长序列的注意力计算性能

Stick-breaking Attention开源项目 – 提高GPU上变长序列的注意力计算性能

Stick-breaking Attention 是一种基于 Triton 的变长序列注意力机制实现，旨在通过优化计算方式提升在 GPU 上的性能，适合多种深度学习任务，易于与现有框架集成。

GPU性能优化Stick-breaking AttentionTriton优化变长序列注意力

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3