Aviary允许在一个地方与各种大型语言模型(LLM)进行交互。用户可以直接比较不同模型的输出,按质量进行排名,并获得成本和延迟估计等功能。它特别支持在Hugging Face上托管的Transformer模型,并在许多情况下还支持DeepSpeed推理加速。
LangSmith是一个旨在帮助开发者缩小原型与生产之间差距的平台,专为构建和迭代能够利用大型语言模型(LLMs)的产品而设计,既能发挥其强大能力,又能应对其复杂性。
gpinterface是一个平台,旨在帮助用户轻松测试和优化他们的提示。用户可以在此平台上讨论如何改进提示并实验来自OpenAI、Anthropic、Mistral AI、Meta等多个模型的表现。
RepublicLabs.ai 是最新的生成型AI网络服务,允许用户使用单个提示同时生成图像和视频,支持多个模型的比较与选择。
关于使用CommonGen-lite数据集对LLM进行评估的研究,使用了GPT-4模型进行评估,比较了不同模型的性能,并列出了排行榜上的模型结果。
NLUX是一个为任意大型语言模型(LLM)提供用户界面支持的JavaScript库,兼容LangChain、HuggingFace和Vercel AI,适用于React、Next.js及纯JavaScript项目,旨在提升用户与AI的交互体验。
Llog是一个为大型语言模型(LLM)设计的协作分析与洞察工具,能够通过简单的请求记录最终用户的交互,并便于所有商业利益相关者从这些日志中提取、分享和推导洞察。
BabyCommandAGI旨在测试命令行界面(CLI)与大型语言模型(LLM)的结合效果,探索它们之间的互动,基于BabyAGI构建,并使用GPT-4 API。通过模拟LLM与CLI之间的对话,项目旨在揭示这种组合可能带来的新机遇与挑战。
MorphTE项目旨在通过在张量嵌入中注入形态学知识,增强自然语言处理任务的效果。它与Fairseq框架集成,提供了对嵌入的形态学意识,帮助提升变换模型的性能。
Huggingface Diffusers的OneFlow移植版,比PyTorch版性能更高,支持多种扩散模型,易于集成与使用。
PromptPoint 是一个无代码平台,旨在快速设计、测试和部署提示,提供自动化提示测试,帮助用户创建和管理提示,评估其有效性,并进行版本控制和部署。它能够测量提示的速度和成本,降低生产部署的风险,释放团队的专业知识。
这是一个基于PyTorch的库,旨在加速在分布外(OOD)检测方面的研究,支持多种检测方法,并提供易用的API设计。该项目结合深度学习模型进行OOD任务,提供数据集和基准测试,且可与PyTorch深度学习框架无缝集成。