Google发布的MobileDiffusion,可以在手机设备上快速进行文本到图像的AI生成!这是一种新颖的方法,具有在设备上快速(亚秒级)文本到图像生成的潜力。
sherpa 是一个针对 llama.cpp 模型的演示应用,专为移动设备设计,提供高效的模型推理和用户友好的界面。
Diarupt允许您在产品中构建基于视频的实时AI交互,使用人性化的头像和真实的声音,能够进行长时间的对话,通过易于使用的API和SDK进行暴露。
Midjourney API由The Next Leg提供,是一个非官方的API,允许用户与流行的AI图像生成工具Midjourney进行交互。用户只需注册订阅计划,获取API密钥,即可开始向Midjourney API发送请求,进行各种图像生成和创意项目。
Dore AI是一个基于AI的移动SDK,适用于iOS和Android开发者,允许他们为移动应用赋予思考和视觉能力。开发者可以通过简单的代码集成SDK,选择适合自己项目的模块。
Aigur.dev 是一个免费的开源库,允许用户组合和调用完全类型化的生成AI管道。用户可以通过声音生成图像,或通过图像创作诗歌!该项目使生成AI的应用场景更加丰富多彩。
FastChat是一个基于Llama-2构建的对话生成项目,支持32k的上下文长度,旨在提供高效的对话生成能力,适用于多种应用场景。它是一个开源项目,易于自定义和扩展,适合开发聊天机器人和进行自然语言处理任务。
该项目让你可以在浏览器里跑一个 DeepSeek-R1-Distill-Qwen-1.5B 模型,使用 🤗 Transformers.js 和 ONNX Runtime Web,本地运行。
Xpress AI是一个创新平台,旨在简化人工智能在应用中的集成,使各类开发者都能轻松访问先进的AI功能。通过单一API提供全面的工具套件,Xpress AI显著减少开发时间,使开发者能够快速高效地整合AI特性。
YoutubeGPT利用OpenAI的Whisper、Embedding和Davinci模型,从YouTube视频中提取文本转录,分段嵌入,并允许用户通过聊天与视频内容进行交互,提供丰富的用户体验。
LLM Prompt & Model Playground 是一个让用户可以并排测试两个LLM提示、模型或配置的工具。它支持多种输入的实时测试,极大地加快了提示和模型的测试过程,并且提供了慷慨的免费使用额度。该项目由Context.ai开发。
Airtrain.ai LLM Playground是一个无代码的平台,可以同时对多种开源和专有LLM(如Claude、Gemini、Mistral AI、OpenAI模型、Llama 2、Phi-2等)进行质量、性能和成本的检查与比较。该平台旨在为用户提供简便的工具,以便在选择合适的语言模型时做出明智的决策。
通过蒸馏技术将复杂模型中的知识转移到更小的模型中,以便在资源受限的设备上有效运行AI模型。
LLaMA-O1 是一个大型推理模型框架,专为 PyTorch 和 HuggingFace 设计,支持训练、推理和评估。它集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、PPO 和类似 AlphaGo Zero 的双策略范式,适用于大型语言模型的开发和应用。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型