标签:模型训练
华为新专利:模型训练与车辆控制的智能驾驶突破
华为技术有限公司公布了一项名为“模型的训练方法、车辆的控制方法及相关装置”的专利,该专利通过获取目标车辆的路况信息,利用第一神经网络模型进行行车意图...
DeepSeek R1推理模型:低成本高性能背后的技术突破与安全挑战
DeepSeek R1推理模型凭借GRPO算法和创新的训练流程,以低成本实现了高性能突破,成为全球大模型技术领域的焦点。然而,其安全机制面临“思维链劫持”攻击的挑战...
监督微调(SFT)在大型语言模型中的应用与挑战
本文深入探讨了监督微调(SFT)在大型语言模型(LLM)中的应用及其与强化学习(RL)的结合。通过分析DeepSeek R1的技术研讨,我们揭示了SFT如何提升模型的可...
TensorFlow Agents:AI智能体开发的强大框架
本文深入探讨了TensorFlow Agents在AI智能体开发中的应用,详细介绍了其核心功能、开发流程以及如何与其他AI智能体开发框架(如LangChain、AutoGen等)进行对...
量子近似优化算法(QAOA):量子计算与AI融合的未来
本文深入探讨量子近似优化算法(QAOA)在量子计算与人工智能融合中的潜力,涵盖其在超高速运算、算法优化、科学研究、医疗创新和网络安全等领域的应用前景,...
检索增强生成(RAG):突破大模型局限的关键技术
本文深入探讨了检索增强生成(RAG)技术如何突破大语言模型的局限,提升其性能和应用场景。文章详细介绍了RAG的工作原理、优势及实际应用案例,并结合大模型...
AI智能体:从开发到应用的全景解析
本文深入探讨了AI智能体的开发流程,从定义目标和需求到模型部署与持续优化,全面解析了智能体的开发步骤。通过智能客服的示例,文章生动展示了智能体的应用...
DeepSeek-V3:MoE模型的革命性突破与行业影响
DeepSeek-V3作为幻方量化推出的自研MoE模型,凭借6710亿参数和3倍生成速度的提升,在多项基准测试中表现卓越,尤其在数学能力上超越了所有开源和闭源模型。其...
AIGC竞争格局深度解析:从上游到下游的全产业链布局
本文深入探讨了AIGC(人工智能生成内容)领域的竞争格局,详细分析了上游的数据供应商、算力供应商和模型训练平台提供商,中游的AIGC技术提供商和AI芯片提供...
半监督学习:定义、发展与应用
本文详细介绍了半监督学习的定义、历史发展、分类方法及其在不同领域的应用,并展望了未来的研究方向。半监督学习是一种介于监督学习和无监督学习之间的机器...