minbpe是一个用于字节级别的字节对编码(BPE)算法的教育性代码,旨在帮助用户理解BPE的工作原理。该项目不仅实现了BPE算法,还支持数据压缩和文本处理,具有可变长度编码以提高表示效率。
ChatGPT.nvim是一个用于与OpenAI GPT-3聊天机器人的Neovim插件,提供了一个易于使用的界面,让用户能够探索GPT-3及其自然语言处理功能。
TigerBot 是一个基于 BLOOM 的多语言多任务大规模语言模型(LLM),在模型架构和算法上进行了多项优化,旨在提供高效的自然语言处理能力,支持多种语言和任务,具有强大的可扩展性。
基于MLX框架的GPT-2模型实现,提供从零开始训练生成式预训练语言模型的教程,使用Python代码约200行,依赖mlx和numpy,适用于Macbook等设备,能在约10分钟内训练完成并生成类似莎士比亚文本的输出
Infini-Megrez是全球首个端侧全模态理解模型,能够同时处理图像、音频和文本数据,具备强大的多模态理解能力。该模型以其高精度、高速度和简单易用性为核心价值,支持场景理解、OCR、中英文语音输入及多轮对话等功能,适用于多种复杂场景下的数据理解和分析。