DALLE-reproduction项目旨在重现OpenAI的DALLE模型,能够根据文本描述生成高质量图像,支持多种文本输入格式,并提供可扩展的模型架构和可调参数,以优化生成效果。该项目实现了多种训练和推理策略,适用于多种应用场景。
Diffusion AI 是一款基于人工智能的Windows软件,通过简单的文本输入将创意转化为惊艳的视觉图像,帮助用户释放创造力,生成高质量的视觉效果。
FLUX.1 AI 是由 Black Forest Labs 开发的一套先进的文本到图像生成模型,提供卓越的图像质量、精准的提示遵循和丰富的风格多样性。用户只需输入详细的文本提示,选择模型类型,然后点击生成高质量图像。
ChatGPT-WEB是一个支持私有化部署的聊天生成模型,旨在保护用户隐私并提供多种功能扩展,适合在本地服务器上使用。
RT-DETR(Real-time DEtection Transformer)是一种在速度和准确率方面均超越YOLO系列的先进物体检测模型,旨在提升计算机视觉任务的效率和效果。该模型采用高效的混合编码器和不确定性最小查询选择方法,支持灵活的速度调整和多尺度特征处理,在COCO数据集上表现出色。
稳定扩散 - DreamStudio是一款创新的开源AI工具,允许用户基于文本描述生成个性化图像,适合艺术家和设计师使用。
Yachay AI是一个基于Byt5的地理标记模型,能够仅通过文本预测坐标。它为开发者提供了支持,以便构建和训练自己的模型,并在Github上提供相关资源和问答支持。
一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题。
这是一个专为健身和物理治疗应用设计的高质量视觉数据集,包含多样化的数据样本,支持机器学习和计算机视觉研究。
Bisheng是一款领先的开源AI大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。
Kansformers是一个基于知识增强网络(KANs)的Transformer架构,旨在提高自然语言处理任务的性能。它提供多种预训练模型,支持针对特定任务的微调,并具备高效的模型推理能力和灵活的API设计,适合多种应用场景。
Generatedby.com是一个简化AI生成提示的创建、测试和共享过程的平台,专为提示工程师和数字工作者设计,旨在通过直观的编辑和优化工具来提高工作效率。
Windows AI Studio是微软提供的官方工具,旨在帮助开发者在本地微调和测试AI模型,支持Phi 2、RAG以及Windows优化模型,整合了Azure AI Studio目录和Hugging Face等资源,确保隐私和数据安全。
介绍如何 DIY 一个端到端的 AI 辅助编程工具,类似于 GitHub Copilot、JetBrains AI Assistant、AutoDev 等。该项目包括从模型选型、数据集构建到模型微调的完整流程,旨在帮助开发者创建符合自身需求的编码助手。
Coin-CLIP是一个开源的多模态模型,专为美国硬币的检索而设计。它结合了图像和文本数据处理能力,支持高效的硬币识别和分类,适合研究人员和开发者使用。
激活信标可以将LLM的原始激活压缩成更紧凑的形式,从而在有限的上下文窗口中感知更长的上下文。它通过短滑动窗口处理长上下文,同时保留LLM在短上下文上的原始能力,显著提高了长上下文语言建模和理解任务的表现。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型