This Is Your Doge, If It Please You: Exploring Deception and Robustness in Mixture of LLMs开源 – 提升多代理LLM系统鲁棒性

该项目研究多代理大型语言模型（MoA）架构在面对欺骗性代理时的脆弱性，并提出了多种无监督防御机制（如“Dropout & Cluster”和“Cluster & Filter”）以恢复性能损失。研究通过基准测试（如AlpacaEval 2.0和QuALITY）评估了欺骗性代理对系统的影响，并分析了欺骗性代理类型、数量、聚合器模型强度等因素。项目旨在提高多代理LLM系统的鲁棒性和安全性，适用于需要高可靠性的应用场景。

This Is Your Doge, If It Please You: Exploring Deception and Robustness in Mixture of LLMs的特点:

1. 评估MoA在AlpacaEval 2.0和QuALITY等基准上的鲁棒性
2. 分析欺骗性代理类型（如Promoter和Opposer）及其影响
3. 提出无监督防御机制（如Dropout & Cluster和Cluster & Filter）
4. 研究欺骗性代理数量、聚合器模型强度和信息传播对系统的影响
5. 提供开源代码，便于进一步研究和应用

This Is Your Doge, If It Please You: Exploring Deception and Robustness in Mixture of LLMs的功能:

1. 改进MoA架构的鲁棒性，适用于自动问答系统
2. 增强决策支持系统对欺骗性代理的抗性
3. 为研究人员提供多代理LLM系统安全性的理论基础
4. 在需要高可靠性的场景中应用防御机制
5. 扩展防御机制以应对更复杂的欺骗策略

相关导航

Generative AI for Beginners开源项目 – 微软推出的生成式AI入门课程

微软推出的生成式AI入门课程，包含12至21个系统课程，涵盖从基础到进阶的全方位知识。课程提供Python和TypeScript代码示例，适配Azure OpenAI和OpenAI API，帮助初学者零基础开启AI应用开发之旅。课程内容包括LLM介绍、提示工程基础、构建文本生成/聊天应用等，并提供实践项目、额外学习资源和官方中文翻译版本，学习路径清晰。

BIP39 Tool开源项目 – BIP39助记词转换工具

BIP39 Tool 是一个用于将 BIP39 助记词转换为地址和私钥的工具，支持在线和离线版本。它帮助用户管理加密货币钱包和交易，代码开源且免费，适用于不同场景下的使用需求。项目提供了详细的地址生成功能，并支持自定义派生路径。

rain开源项目 – 逼真的下雨天窗户效果

一个用JavaScript实现的逼真的下雨天窗户效果项目，能够模拟动态雨滴，支持自定义雨滴密度和多种背景设置，轻量级且易于集成。

BooookScore开源项目 – 超长文本总结与评估框架

BooookScore是一个专为处理超长文本（如书籍）总结而设计的框架，能够将超过100K字的文本切分成更小的块，并通过提示LLM（大语言模型）合并、更新和压缩块级摘要。它支持分层合并和增量更新两种方案，以确保生成的全文总结具有连贯性。此外，BooookScore还能够评估超长文本总结的连贯性错误，并提供多种功能来优化总结过程。

D8VK开源项目 – Direct3D 8 转 Vulkan 的转换层

D8VK 是 DXVK 的 Direct3D 8 实现，提供了一个基于 Vulkan 的转换层，用于将 Direct3D 8 调用转换为 Vulkan API。该项目旨在支持在非 Windows 平台上运行 Direct3D 8 应用程序，并提供更好的图形性能和稳定性。D8VK 继承了 DXVK 的高效性和兼容性，是一个开源项目，允许社区贡献和改进。

GPT Router开源项目 – 通用的LLM API网关

GPT Router是一个开源的LLM API网关，提供超过30个LLM、视觉和图像模型的通用API，具备基于可用性和延迟的智能回退、自动重试和流式传输功能，即使在OpenAI宕机时也能保持操作。

MIDI-3D开源项目 – 单图转360度3D场景

MIDI-3D是一个开源项目，专注于将单张图像转化为360度3D场景，利用先进的AI技术实现高保真度的3D场景生成。该项目通过智能分割输入图像，识别场景中的独立元素，并基于多实例扩散模型和注意力机制生成3D场景，具有强大的全局感知能力和细节表现力。在40秒内完成3D场景生成，且对不同风格的图像具有良好的泛化能力。此外，它支持对场景中的多个物体进行3D建模，避免了逐个生成再组合的复杂过程。

OpenCV开源项目 – 开源计算机视觉库

OpenCV是一个开源的计算机视觉和机器学习软件库，提供了丰富的图像处理和计算机视觉算法。它支持多种编程语言和跨平台运行，适用于各类AI应用，包括图像处理、物体识别、视频分析等。OpenCV还针对不同硬件架构进行了优化，并支持深度学习模块，可加速矩阵乘法等操作。

Rain开源项目 – 多功能工具，快速生成Logo

Rain是由SuPerCxyz在GitHub上托管的一个项目，它是一个多功能工具，具体用途未明确说明，但提供了多种功能，包括快速生成Logo等。

Unified Video Action Model开源项目 – 统一视频与动作建模

Unified Video Action Model 是一个专注于视频与动作建模的项目，旨在帮助机器人理解视频内容并预测后续动作。通过两阶段的训练方法，先进行视频生成，再进行动作预测，从而实现更优的效果。该项目支持多种模拟与真实机器人任务，涵盖了PushT、Libero10等数据集，并提供了Colab笔记本，方便用户快速上手体验。

DeepScaleR开源项目 – 让强化学习平民化

DeepScaleR旨在为大语言模型（LLMs）提供强大的性能提升，仅用1.5B参数就超越了7B参数模型的性能。该项目完全开源，包括训练脚本、模型、数据集和日志，特别适用于参与AIME 2024竞赛的模型。

Intel Extension for Transformers

Intel Extension for Transformers 是一个开源项目，旨在使客户端 CPU 上的大型语言模型（LLM）微调成为可能，特别是在没有 GPU 的情况下。它支持在 CPU 上进行 QLoRA 微调，适用于笔记本电脑环境，并通过优化的性能提升模型训练效率。该项目与 HuggingFace Transformers 兼容，支持 4 位推理，并利用 Intel 神经压缩器提供丰富的模型压缩技术，如量化、剪枝和蒸馏，显著提高了英特尔平台上的推理效率。此外，它还支持自动化的仅限权重的 INT4 量化流程，兼容多个流行的大语言模型，如 Llama2、Llama 和 GPT-NeoX。

Plate开源项目 – 基于 React 的强大富文本编辑器

Plate 是一个基于 React 的富文本编辑器框架，提供了 50+ 个插件可以直接开箱即用，支持与现有系统无缝集成，同时也允许进行组件的定制开发，满足不同用户的需求。

Qlib开源项目 – AI量化投资平台

Qlib 是一个开源的、面向人工智能的量化投资平台，旨在利用人工智能技术在量化投资中实现潜力、赋能研究和创造价值。它支持从数据管理到模型训练、回测的完整机器学习流程，涵盖了量化投资的整个链条，包括alpha挖掘、风险建模、组合优化和订单执行。Qlib 支持多种机器学习建模范式，如监督学习、市场动态建模和强化学习，并提供了强大的基础设施来支持量化研究。