FastHugs是一个结合HuggingFace transformers和fastai-v2的工具,专门用于微调文本分类模型。它提供了简单易用的API接口,支持快速迭代和实验,适用于研究和生产环境。
Rigging是一个轻量级的LLM交互框架,旨在简化生产代码中语言模型的应用。它提供了结构化Pydantic模型与非结构化文本输出之间的互操作性,支持LiteLLM等多种语言模型。用户可以通过Python函数定义提示,进行异步批处理和快速迭代,非常适合大规模生成任务。
Open Interpreter 是一个可以在本地命令行中运行的代码解释器,它允许大型语言模型(LLM)在本地执行代码,支持多种编程语言并提供便捷的命令行界面。
a1gpt是一个基于C++的GPT-2推理引擎,旨在提供高效的文本生成能力,支持多种输入格式并具备良好的可扩展性,使其便于集成到各种项目中。同时,a1gpt在内存管理方面进行了优化,以提升性能和效率。
LLM Hosting Container 是一个用于部署和托管大型语言模型的解决方案,具备与AWS服务的无缝集成,提供易于使用的API接口,并支持自动扩展和负载均衡,优化性能以满足高并发需求。
VERSE-65B 是由深圳元象科技自主研发的支持多语言的大语言模型,参数规模为 650 亿,开源的底座模型。
Writetone是一款Chrome扩展程序,帮助用户写作清晰、简洁且有效的文本,具备语法检查和摘要功能。该工具还可以帮助用户以所需的语气回复社交媒体消息。
Umělá inteligence Deeply 是一款未来派的 AI 应用程序,能够在一分钟内创建营销文本、博客文章、逼真的图形、社交媒体帖子、更好的内容、广告等。
Nexa SDK是一款全面支持ONNX和GGML模型的工具包,具备文本生成、图像生成、视觉-语言模型(VLM)、自动语音识别(ASR)和文本到语音(TTS)功能,提供OpenAI兼容的API服务器,支持JSON模式调用函数和流媒体,配备用户友好的Streamlit UI,方便开发者使用和集成。
本综述旨在提供关于利用大型语言模型进行NLG评估的全面概述,提出了一个系统的分析框架,以理解和比较这些方法。通过讨论未解决的挑战,包括偏见、鲁棒性、领域特异性和统一评估,本综述旨在为研究人员提供洞见,并倡导更公平和先进的NLG评估技术。
Mamba是一种硬件感知的并行算法,旨在解决在语言处理任务中处理长序列时的低效问题。通过实现,Mamba实现了快速推理、线性可扩展性,并在性能上与更大的Transformer模型相媲美。
TinyStories是一个参数量小于1000万的大语言模型,能够流利地讲英语,表明较小的模型在经过微调后也可以胜任单一任务。
由大型语言模型(LLM)驱动的代码文档生成工具,专注于自动生成代码文档,支持多种编程语言,包括Python、Typescript、Javascript等,利用OpenAI或本地LLM确保数据安全。
Time-LLM 是一个通过重新编程大型语言模型来进行时间序列预测的项目,能够高效处理和预测各种时序数据。