标签:大模型技术
DeepSeek领跑AI应用榜,国产AI崛起势头强劲
DeepSeek凭借其卓越的R1模型技术和显著的价格优势,成为全球增速最快的AI应用之一。其在多个国家的应用商店中霸榜,展现了国产AI的强大竞争力。尽管算力资源...
通义Qwen2.5-1M模型:Dual Chunk Attention机制助力长文本处理新突破
阿里云通义最新发布的Qwen2.5-1M模型,通过创新的Dual Chunk Attention机制,成功支持100万Tokens的上下文处理,显著提升了长文本任务的效率和性能。这一技术...
智能终端Agent引领大模型技术落地新篇章
2025年2月21日,阶跃星辰在上海举办首届Step UP生态开放日,展示了丰富的大模型应用场景和创新体验,并强调智能终端Agent作为大模型技术落地的关键发力点。吉...
GPT-4.5:无监督学习扩展的新里程碑,情商与幻觉控制的突破
OpenAI最新发布的GPT-4.5研究预览版,通过无监督学习扩展技术,显著提升了情商表现和幻觉控制能力。尽管API定价高昂,但其在SimpleQA常识问答测试中的优异表...
LLMxMapReduce技术:打破大模型记忆限制的革命性突破
清华大学与厦门大学联合提出的LLMxMapReduce技术,通过长文本分帧处理,结合结构化通信协议和上下文置信度校准机制,实现了大模型记忆限制的突破。该技术在多...
Qwen2-72B:大模型技术的新突破与未来展望
本文探讨了Qwen2-72B大模型的技术突破,结合LLMxMapReduce长文本分帧处理技术,分析其在长上下文处理中的优势,并展望其在未来人工智能领域的应用潜力。
开源与闭源竞速:DeepSeek如何重塑AI技术格局
本文探讨了DeepSeek如何通过开源模式打破闭源垄断,推动AI技术发展。文章深入分析了DeepSeek的核心技术、开源策略及其对AI生态的深远影响,并展望了AI未来的...
大模型技术赋能多领域:从技术突破到产业应用的深度解析
本文深入探讨了大模型技术的发展历程及其在多个领域的应用,结合中国人工智能学会编写的2023版白皮书,分析了大模型的关键技术、平台工具及其在工业、出版、...
人工智能教育新趋势:从提示学习到创新能力的培养
本文探讨了人工智能教育在中小学中的普及趋势,特别是提示学习如何引导学生探索智能时代的学习方式。文章还分析了人工智能教育面临的挑战,并提出了构建完善...
大模型技术深度解析:从开发到应用的全景视角
本文深入探讨了大模型技术的发展历程、关键技术及其在多领域的应用,特别聚焦于GPT系列、Claude系列、文心一言和讯飞星火等大模型的特色与实战应用,为读者提...