标签:图像生成
Infinity模型:图像生成的新纪元,超越Diffusion Model的创新突破
字节商业化技术团队开发的Infinity模型,基于NeurIPS最佳论文VAR衍生而来,通过bitwise tokenizer细粒度建模图像空间,词表扩展至无穷大,模型规模达20B,在...
Infinity模型:基于Bitwise Tokenizer的革命性图像生成技术
新开源模型Infinity由字节商业化技术团队开发,基于NeurIPS最佳论文VAR技术,通过细粒度的bitwise tokenizer建模图像空间,将词表扩展到无穷大,显著提升了图...
Open WebUI:打造多功能自托管 AI 平台的利器
Open WebUI 是一个功能丰富的自托管 AI 平台,支持多种 LLM 运行器,如 Ollama 和 OpenAI 兼容的 API。它提供细粒度的权限管理、响应式设计、完整的 Markdown...
Open WebUI:自托管AI平台的强大功能与应用场景
Open WebUI 是一个功能丰富的自托管 AI 平台,支持多种 LLM 运行器,如 Ollama 和 OpenAI 兼容的 API。它提供细粒度的权限管理、完整的 Markdown 和 LaTeX 支...
ICML 2023最佳论文奖揭晓:SD3引领图像生成新浪潮
ICML 2023公布了今年最佳论文奖,图像生成模型SD3凭借其创新性技术脱颖而出。本文将深入探讨SD3的核心技术,包括多模态统一表示空间、Dream Engine框架及其在...
探索AI开源项目:从Stable Diffusion到深度学习的创新之旅
本文将带你探索20个与AI相关的开源项目,涵盖机器学习、深度学习、计算机视觉等多个领域,重点介绍Stable Diffusion在图像生成中的应用及其技术细节,助你快...
探索GAN的未来:从理论到实践的全面解析
本文深入探讨了GAN(生成对抗网络)的最新进展,包括其在图像生成领域的应用、理论基础的构建以及未来研究方向。文章还提供了使用PyTorch搭建GAN模型的实用指...
豆包升级:实时语音大模型引领智能交互新潮流
豆包近期进行了多项重磅升级,包括实时语音通话功能、智能语音识别与输入、多语言支持、数据分析与可视化、智能推荐系统等,推出了全新的豆包模型家族,极大...
2024年AI生成模型的前沿进展与未来展望
2024年AI生成模型领域取得重大突破,涵盖大语言模型、图像生成、多模态与智能体等技术。OpenAI、Claude、xAI等公司推动技术发展,DeepSeek CEO梁文峰强调开源...
深入了解机器学习:从基础到前沿的全面指南
麻省理工出版社出版的《深入了解机器学习》是一本适合初学者和有开发经验者的AI书籍,涵盖监督学习、卷积网络、图像生成、扩散模型和图神经网络等知识点,并...