标签:大语言模型
DeepSeek-R1模型引领水务行业智能化转型
山科智能积极推动水务行业的智能化转型,自2024年二季度起将大语言模型接入自主研发AI平台,并成功部署DeepSeek系列模型。DeepSeek大模型在自然语言处理和深...
ARC-AGI:AI抽象推理与模式识别的新标杆
本文探讨了ARC-AGI作为AI抽象推理与模式识别的新评价标准,分析了其在大语言模型时代的价值。文章回顾了深度学习领域的突破,如李飞飞的ImageNet和辛顿的Alex...
DeepSeek-R1与O1-preview:AI模型的性能与挑战
本文探讨了DeepSeek-R1与OpenAI的O1-preview模型在性能、优化和技术挑战上的对比。DeepSeek-R1凭借低成本和高效能引发关注,而O1-preview则展示了强大的推理...
DeepSeek-V3:MoE架构如何重塑AI开发格局
DeepSeek-V3凭借其创新的MoE架构和开源策略,正在重新定义AI开发的边界。本文将深入探讨MoE架构的技术优势、DeepSeek-V3的低成本高性能特性,以及开源AI对未...
DeepSeek V2 Chat:大语言模型技术的新突破
DeepSeek V2 Chat作为DeepSeek公司推出的大语言模型,通过混合精度计算和低延迟通信技术,显著提升了模型效率。本文将深入探讨其技术细节、应用场景以及市场...
DeepSeek Coder V2:革新PDF代码提取与分析的技术突破
DeepSeek Coder V2作为DeepSeek公司的重要技术成果,专注于PDF文档中的代码提取与分析。本文深入探讨其技术优势、应用场景及其在文档处理领域的革新意义,帮...
DeepSeek V2.5:低成本高性能的AI革命
DeepSeek V2.5以其低成本和高性能在AI领域掀起了一场革命。通过创新的技术优化和开源策略,DeepSeek不仅挑战了美国AI的领先地位,还在全球范围内推动了AI的普...
DeepSeek V2:大语言模型的创新与突破
DeepSeek V2作为中国创新型科技公司幻方量化的杰作,以其低成本和高效能的大语言模型技术引领AI领域。本文将深入探讨DeepSeek V2的技术特点、市场影响及其在...
GRPO算法:大语言模型在推理任务中的强化学习新突破
本文深入探讨了GRPO算法在大语言模型中的应用,特别是其在数独求解任务中的表现。文章还分析了元强化学习在优化测试时计算中的潜力,揭示了GRPO算法在复杂推...
DeepSeek-V3:AI产业的新星与开源革命的引领者
DeepSeek-V3作为中国AI领域的创新代表,凭借其低训练成本、高性能以及开源策略,迅速在全球AI产业中引发关注。本文将深入探讨DeepSeek-V3的技术亮点、开源策...