大语言模型 | 第 16 页

探索LLM的自我解释能力与Data Attribution的前沿应用

本文探讨了大语言模型（LLM）在自我解释能力上的局限性，特别是生成反事实解释的挑战。同时，结合ICML 2024的最新研究，深入分析了Data Attribution问题在LLM...

AI快讯

2个月前

随着大语言模型的快速发展，网络安全领域迎来新机遇，但也面临更大挑战。本文探讨了AI技术在网络安全中的应用、Fortinet的创新解决方案，以及如何应对日益复...

AI百科

2个月前

本文深入探讨了基于Langchain的Agent框架，重点解析了提示词（如ReAct、Self-Ask with Search、结构化聊天）与工具集的集成。提示词作为教大语言模型如何思考...

AI快讯

2个月前

本文深入探讨了强化学习与人类反馈（RLHF）技术，揭示其如何通过人类偏好数据优化大语言模型，减少模型幻觉和毒性，提升生成内容的准确性和可接受性。RLHF不...

AI快讯

2个月前

谷歌的PaLM-E项目将多模态AI与机器人技术深度融合，通过思维链、向量数据库等技术，使RT-2机器人性能显著提升。PaLM-E不仅实现了模拟基准的SOTA结果，还展示...

AI快讯

2个月前

本文深入探讨了TDgpt的功能及其在时序数据预测和异常检测中的应用，对比了其与传统方法、时序大语言模型及非语言大模型的差异，揭示了其在各场景中的广泛适用...

AI快讯

2个月前

本文深入解析TDgpt的功能及其与传统时序数据预测和异常检测的区别，探讨其与时序大语言模型的差异，并介绍其在非语言大模型中的独特优势。TDgpt作为基于Llama...

AI快讯

2个月前

本文深入探讨TDgpt的功能及其在时序数据预测和异常检测中的独特优势。TDgpt基于通用大语言模型Llama，适用于所有场景且无需技术细节，是传统方法的革新替代品。

AI快讯

2个月前

DeepSeek在2025年开源了针对Hopper GPU优化的FlashMLA解码内核，专为处理可变长度序列设计。通过动态调度和内存优化，FlashMLA大幅提升了AI模型的解码效率，...

AI快讯

2个月前

DeepSeek最近发布的开源模型DeepSeek-R1在多个测试中表现优异，接近甚至超越OpenAI的o1正式版。AI业界对此广泛讨论，认为开源模型可能改变大模型竞争格局，Me...

AI快讯

2个月前