大语言模型集成工具LangChain的TypeScript版本,支持在不依赖Python的情况下实现各种功能,如Embeddings、文本分割等。
该项目是Hugging Face Tokenizers库的C++复现版本,旨在提供高性能的分词功能,支持多种语言模型,并且与Python版本兼容,允许用户自定义分词策略。
Hunyuan-Large是腾讯推出的大型MoE(Mixture of Experts)模型,拥有3890亿参数和520亿激活参数,是业界目前最大的开源Transformer基础MoE模型,专注于自然语言处理和长文本理解。
一个专门用于长文本总结的LLM工具,可以将电子书或PDF自动分段处理并生成详细的要点总结。支持epub和pdf格式,能自动提取章节,将文本分成~2000 token的小块进行处理,最终生成结构化的笔记和总结,特别适合学习研究和知识整理。
Regex.ai 是一个利用人工智能技术生成和解决正则表达式的工具,用户只需插入文本并高亮多个字符串,即可找到匹配的正则表达式。该工具能够根据提供的文本自动生成和解析正则表达式,便于数据提取、文本处理及模式匹配等多种应用场景。