Linly是基于Falcon模型的增强版本,通过扩充中文词表并在中英文数据上进行增量预训练,旨在提升自然语言处理任务的效果。
TAWNY是一个情感分析平台,能够分析驱动消费者决策和行为的人类情感状态。
Sweephy是一个无代码的数据清洗、准备和机器学习平台,帮助企业从原始数据中获取价值。它专注于为各种业务案例开发定制解决方案,并提供本地安装选项以增强数据隐私。
本项目基于Meta发布的可商用大模型Llama-2开发,开源了中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语义和指令理解能力,相比一代相关模型获得了显著性能提升。相关模型支持4K上下文并可通过NTK方法最高扩展至18K+。
Eternity AI是印度理工学院帕特纳分校的一个研究项目,旨在构建一个以人为本的语言模型,能够通过访问实时互联网来模拟人类行为,减少幻觉,并在超过10万个行为参数上进行训练。
Dromedary是IBM开源的一个基于LLaMA的大语言模型,旨在通过最少的人工监督训练实现高效的自然语言处理,结合基于原则的推理与LLMs的生成能力,致力于解决人类监督在质量和可靠性方面的问题。
GPT for Sheets是一个将GPT(生成预训练变换器)能力整合到Google Sheets中的插件,帮助用户进行创意生成、数据分类、翻译、语法修正和文档摘要等多种任务。用户需在Google Sheets中安装此插件,安装后可通过公式栏访问GPT功能,应用于所需单元格或范围。
一个简单快速的中文分词和命名实体识别工具,使用最新数据的字典文件,提供更合理的词频统计,分词速度是知名“结巴”中文分词的两倍。
该研究定义了一种风格的语言模型代理,该代理具有推理和运用外部知识的能力,通过对先前轨迹的迭代训练来提升其性能。