该项目是Hugging Face Tokenizers库的C++复现版本,旨在提供高性能的分词功能,支持多种语言模型,并且与Python版本兼容,允许用户自定义分词策略。
NLPretext是一个综合性的NLP文本预处理库,提供多种文本处理功能,旨在为各种NLP用例提供高效和灵活的解决方案。它支持大规模文本数据的高效处理,并且允许用户根据需求定制预处理选项,方便集成和使用。
大语言模型集成工具LangChain的TypeScript版本,支持在不依赖Python的情况下实现各种功能,如Embeddings、文本分割等。
AI Cases Convert 是一个自动将文本转换为不同格式的工具,用户只需输入文本,选择所需的格式,然后点击'转换'按钮即可立即获得结果,方便快捷。
Aquila语言大模型是在中英文高质量语料基础上从0开始训练的开源语言模型,具备更高效的训练效率和优秀的性能。
Manipulist是一个基于浏览器的文本/列表处理和抓取工具,由Engiweb Ltd开发。它允许用户对输入文本执行多种操作,以实现所需的输出文本。用户只需通过网页浏览器访问,无需下载任何软件或应用程序。
Open in ChatGPT 是一款Chrome扩展,允许用户将选定的文本直接在ChatGPT中打开,并附加自定义提示。用户只需右击所选文本,从上下文菜单中选择'在ChatGPT中打开'选项,即可快速使用。
cuanto是一个使用create-react-app构建的网络应用,利用人工智能算法执行各种任务,用户无需安装或设置,简单易用。
SidekickSpace是一个保护敏感信息免受AI算法侵害的平台,提供客户端遮蔽功能,确保企业和程序员的数据隐私与控制。用户可以使用遮蔽工具将敏感文本替换为占位符,并利用AI生成准确的答案,随后无缝替换回原始内容,以实现有效沟通。
FlexGen: 针对面向吞吐量的场景在单个 GPU 上运行大型语言模型,旨在提高模型的运行效率和简化部署过程。