标签:图像生成

下一代图像生成技术:Next-Scale Prediction与视觉自回归建模

字节跳动前实习生田某某因“破坏大模型训练”事件引发热议,但其与字节跳动合作的论文《视觉自回归建模:通过下一尺度预测实现可扩展的图像生成》却在人工智能...

从争议到荣耀:NeurIPS 2024最佳论文背后的视觉自回归建模技术

字节跳动前实习生田某某因涉嫌破坏大模型训练被公司起诉,索赔800万元。然而,他参与的论文《视觉自回归建模:通过下一尺度预测实现可扩展的图像生成》在Neur...

Gemma 2 – 9B:AI大模型的革新与应用

Gemma 2 - 9B是一款拥有90亿参数的AI大模型,具备强大的自然语言处理、图像生成和多模态任务能力。该模型结合了最新的深度学习技术和高效的训练策略,适用于...

视觉自回归模型:图像生成的新范式与未来展望

北京大学和字节跳动团队在NIPS 2024会议上获得最佳论文奖,提出了一种名为Visual Autoregressive Modeling (VAR)的新型图像生成范式。本文深入探讨了视觉自回...

VAR:图像生成新框架,NeurIPS 2024最佳论文的突破与争议

字节跳动起诉前实习生篡改代码并索赔800万,然而该实习生与团队合作发表的论文在NeurIPS 2024上获得最佳论文奖。论文提出了一种新的图像生成框架VAR,该框架...

生成对抗网络(GANs):人工智能的创造力引擎

生成对抗网络(GANs)作为人工智能领域的重要技术,正在推动图像生成、文本生成等领域的突破性进展。本文将深入探讨GANs的工作原理、应用场景及其未来发展方...

AIGC技术驱动下的行业变革与未来展望

本文深入探讨了AIGC技术在自动化行业中的应用与前景,特别是CLIP模型与Diffusion模型在AI绘画和图像生成领域的结合。文章还分析了ChatGPT在物联网、机器人技...

生成对抗网络(GANs):从基础到应用的全面解析

本文深入探讨了生成对抗网络(GANs)的基本原理、关键技术、应用场景及其面临的伦理挑战。通过详细解析GANs的架构设计、训练策略以及在实际应用中的表现,帮...

视觉自回归建模与下一尺度预测:图像生成的未来趋势

实习生田某某的论文《视觉自回归建模:通过下一尺度预测实现可扩展的图像生成》荣获NeuralPS 2024最佳论文奖。该论文由字节跳动与北京大学合作发表,探讨了一...

3D感知图像生成:从理论到应用的前沿探索

本文深入探讨了3D感知图像生成领域的最新进展,涵盖了深度估计、立体匹配、BEV检测、3D重建等关键技术,并结合实际应用场景,如自动驾驶、机器人导航等,展示...
1 2 3