大语言模型 | 第 2 页

DeepSeek-R1模型引领水务行业智能化转型

山科智能积极推动水务行业的智能化转型，自2024年二季度起将大语言模型接入自主研发AI平台，并成功部署DeepSeek系列模型。DeepSeek大模型在自然语言处理和深...

AI快讯

3个月前

本文探讨了ARC-AGI作为AI抽象推理与模式识别的新评价标准，分析了其在大语言模型时代的价值。文章回顾了深度学习领域的突破，如李飞飞的ImageNet和辛顿的Alex...

AI快讯

3个月前

本文探讨了DeepSeek-R1与OpenAI的O1-preview模型在性能、优化和技术挑战上的对比。DeepSeek-R1凭借低成本和高效能引发关注，而O1-preview则展示了强大的推理...

AI快讯

3个月前

DeepSeek-V3凭借其创新的MoE架构和开源策略，正在重新定义AI开发的边界。本文将深入探讨MoE架构的技术优势、DeepSeek-V3的低成本高性能特性，以及开源AI对未...

AI快讯

3个月前

DeepSeek V2 Chat作为DeepSeek公司推出的大语言模型，通过混合精度计算和低延迟通信技术，显著提升了模型效率。本文将深入探讨其技术细节、应用场景以及市场...

AI快讯

3个月前

DeepSeek Coder V2作为DeepSeek公司的重要技术成果，专注于PDF文档中的代码提取与分析。本文深入探讨其技术优势、应用场景及其在文档处理领域的革新意义，帮...

AI快讯

3个月前

DeepSeek V2.5以其低成本和高性能在AI领域掀起了一场革命。通过创新的技术优化和开源策略，DeepSeek不仅挑战了美国AI的领先地位，还在全球范围内推动了AI的普...

AI快讯

3个月前

DeepSeek V2作为中国创新型科技公司幻方量化的杰作，以其低成本和高效能的大语言模型技术引领AI领域。本文将深入探讨DeepSeek V2的技术特点、市场影响及其在...

AI快讯

3个月前

本文深入探讨了GRPO算法在大语言模型中的应用，特别是其在数独求解任务中的表现。文章还分析了元强化学习在优化测试时计算中的潜力，揭示了GRPO算法在复杂推...

AI快讯

3个月前

DeepSeek-V3作为中国AI领域的创新代表，凭借其低训练成本、高性能以及开源策略，迅速在全球AI产业中引发关注。本文将深入探讨DeepSeek-V3的技术亮点、开源策...

AI快讯

3个月前