elmer是一个R语言的LLM API调用工具,让用户友好地接入主流的大型语言模型服务,支持流式处理和R函数的轻松注册调用。
vLLM Endpoint | Serverless Worker是一个用于提供大型语言模型端点的RunPod工作模板,基于VLLM技术,支持高效的模型加载与推理,具有极强的扩展性,适合在云环境下快速部署。
LLM Hosting Container 是一个用于部署和托管大型语言模型的解决方案,具备与AWS服务的无缝集成,提供易于使用的API接口,并支持自动扩展和负载均衡,优化性能以满足高并发需求。
知识图谱检索增强生成框架,将知识图谱(KG)的显式知识与大型语言模型(LLM)的隐式知识结合起来。KG-RAG在生物医学数据集上显著提升了模型的性能,尤其是对Llama2和GPT模型的增强效果达71%。
clueai是一个开源的自然语言处理工具,用户可以在短时间内快速定制和部署自己的NLP API,旨在简化自然语言处理的集成过程,支持多种语言和模型,适合开发者和研究人员使用。
一个用于中文信息抽取的项目,基于LLaMA和Alpaca模型,结合LoRA技术进行微调。该项目旨在提供高效、准确的中文文本处理能力,特别是在命名实体识别(NER)方面,支持多种训练和评估配置,方便用户根据需求进行模型微调与集成。
PoplarML是一个平台,允许用户轻松部署生产就绪且可扩展的机器学习系统,工程投入极少。它提供命令行工具,支持将ML模型部署到GPU集群,并兼容Tensorflow、Pytorch和JAX等流行框架。用户可以通过REST API端点调用模型,实现实时推断。