模型结构分析

Finding Transformer Circuits with Edge Pruning开源项目 – 通过边缘修剪识别变压器电路

Finding Transformer Circuits with Edge Pruning开源项目 – 通过边缘修剪识别变压器电路

论文介绍了通过边缘修剪找到变压器电路的技术，旨在有效识别和分析变压器电路，从而提高模型的可解释性。该技术可以帮助研究人员和开发者更好地理解变压器模型的结构及其工作原理。

变压器电路识别模型可解释性模型结构分析神经网络优化

Interpretable Self-Aware Prediction开源项目 – 提高神经网络对分布外数据的认知不确定性

Interpretable Self-Aware Prediction开源项目 – 提高神经网络对分布外数据的认知不确定性

用于稳健弹道预报的可解释自感知神经网络，旨在提高神经网络对分布外数据的认知不确定性估计，以适应安全关键型应用，如自动驾驶汽车。

可解释的自感知预测安全关键应用机器学习模型可解释性神经网络不确定性估计

Transformer Explainer开源项目 – 交互式可视化 Transformer 学习工具

Transformer Explainer开源项目 – 交互式可视化 Transformer 学习工具

一个 Transformer 可视化交互式学习工具，通过输入文本实时观察各个组件如何处理，最终预测下一个 Token。

Transformer可视化工具交互式学习工具教学工具自注意力机制演示

Moonshot开源项目 – 评估大型语言模型的工具

Moonshot开源项目 – 评估大型语言模型的工具

一款用于评估和红队任何大型语言模型（LLM）应用的简单且模块化工具，由AI验证基金会开发，集成了基准测试和红队测试，帮助AI开发者、合规团队和AI系统所有者评估LLMs和LLM应用。

AI开发者工具LLM评估工具合规评估工具红队测试

nnsight开源项目 – 深度学习模型解释与操控工具

nnsight开源项目 – 深度学习模型解释与操控工具

nnsight包使得用户能够解释和操控深度学习模型的内部结构，支持多种深度学习框架，帮助研究和实验。

模型可视化工具深度学习模型操控工具深度学习模型解释工具

稀疏自动编码器开源项目 – 提取可解释特征，理解神经活动

稀疏自动编码器开源项目 – 提取可解释特征，理解神经活动

OpenAI改进了大规模训练稀疏自动编码器的方法，以提取可解释特征并理解语言模型的神经活动。

可解释性特征提取神经活动理解稀疏自动编码器

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3