AI开源项目 | 第 35 页

kan-gpt是一个结合Kolmogorov-Arnold Networks（KAN）特性的GPT模型，使用PyTorch框架实现。该项目在Tiny Shakespeare数据集上进行了训练和测试，表现优于传统的MLP-GPT模型。作为一个开源项目，kan-gpt不仅便于社区贡献和进一步研究，还为自然语言处理任务提供了新的解决方案。

0

GPT模型KAN神经网络PyTorch框架开源项目

xLSTM-7B开源项目 – 扩展LSTM模型，高效推理

xLSTM-7B是一种扩展的LSTM模型架构，通过引入Exponential Gating和Matrix Memory等技术，克服了传统LSTM的局限性。相较于Transformer架构，xLSTM-7B在推理速度和参数效率方面表现出显著优势，适用于多种序列数据处理任务。

0

序列建模扩展LSTM模型时间序列预测自然语言处理

HZPROC开源项目 – Torch数据增强工具箱

HZPROC是一个专为Torch设计的数据增强工具箱，支持仿射变换等多种数据增强技术。它易于集成到现有的Torch流程中，性能高效且优化，能够显著提升模型的泛化能力。

0

Torch数据增强工具箱仿射变换图像数据集增强模型泛化能力提升

vitsGPT开源项目 – 语义增强的文本到语音合成工具

vitsGPT是一个基于大规模语言模型的语义意识增强文本到语音合成工具，提供PyTorch实现。它支持多种语义评估指标和数据集，旨在提升文本到语音合成的语义准确性和自然度。

0

PyTorch实现文本到语音合成语义增强

SLOP开源项目 – 简化AI API通信协议

Simple Language Open Protocol (SLOP) 是一个简化的 AI API 通信协议，旨在通过标准的 HTTP 请求和 JSON 数据格式，提供一个统一的方式与任何 AI 服务进行交互。它支持多Agent协作、实时流式交互，并遵循开放、简单和灵活的原则。

0

AI API通信协议HTTP请求JSON数据格式多Agent协作

Awesome-TimeSeries-AIOps-LM-LLM开源项目 – 时态数据与AIOps资源大全

该项目是一个关于大型语言模型和基础模型在时态数据（时间序列、时空和事件数据）以及AIOps领域应用的资源列表。它提供了全面的资源，包括论文、代码、数据集等，系统地总结了该领域的最新进展，为研究者和开发者提供了可靠的参考。

0

AIOps大型语言模型开源项目时间序列分析

fastai v2时序处理包开源项目 – fastai v2的时序数据处理工具

fastai v2时序处理包是专为fastai v2框架设计的时序数据处理工具，支持多种时序数据格式，提供高效的预处理功能，并集成了多种时序模型的训练和评估方法。该工具易于扩展和自定义，能够无缝集成到现有的fastai v2工作流中，适用于时序数据的预处理、模型训练、评估、可视化及自定义流程。

0

fastai v2时序处理工具时序数据处理时序模型训练

MM-EUREKA开源项目 – 多模态强化学习项目

MM-EUREKA是一个探索视觉‘顿悟时刻’的多模态强化学习项目，首次将基于规则的强化学习应用于多模态推理，实现文本和视觉信息的高效融合。该项目无需监督微调，通过规则化训练显著提升模型推理能力，并开源完整训练流程，包括代码、模型和数据，助力研究者快速上手。

0

AI推理能力提升多模态强化学习开源项目文本和视觉信息融合

sd-webui-stablesr开源项目 – 超分辨率放大工具

StableSR 是一个创新的超分辨率放大项目，专注于为模糊画面生成精致细节。该项目已集成到web-ui中，使用方便，且对低显存进行了优化，支持在小于12GB显存的环境中进行4K图像放大。官方演示效果令人惊叹，对模糊照片的修复效果几乎完美。

0

4K图像放大web-ui集成低显存优化模糊照片修复

tlnmf开源项目 – 正交流形上的拟牛顿NMF算法

tlnmf是一个在正交流形上实现拟牛顿算法的非负矩阵分解（NMF）工具，结合了变换学习以提升分解效果。该项目专为信号处理和数据分析领域设计，适用于多种矩阵分解任务。

0

主题建模信号处理数据分析源分离

DistilBERT开源项目 – 轻量级高性能BERT模型

DistilBERT是一款基于BERT的轻量级Transformer模型，通过蒸馏技术显著减少了模型的大小和计算复杂度，同时保持了高性能。它特别适用于资源有限的环境，如移动设备或嵌入式系统，能够在文本分类、命名实体识别和问答系统等任务中表现出色。

0

命名实体识别文本分类移动端应用轻量级Transformer模型

ChatGLM.cpp开源项目 – C++实现的ChatGLM-6B

ChatGLM.cpp是ChatGLM-6B的C++实现版，专为在macBook等设备上运行而设计。它通过C++实现优化了性能和资源使用，使其能够在资源受限的环境中高效运行，同时保持与ChatGLM-6B模型的兼容性。

0

C++实现ChatGLM-6B嵌入式设备深度学习模型

HAL开源项目 – 训练超人类AI玩《任天堂明星大乱斗》

HAL是一个专注于训练超人类AI来玩《任天堂明星大乱斗》的项目。它通过使用优势加权回归来增强AI的决策能力，并支持多GPU训练以加速模型优化。HAL提供了一个完整的工作流程，从数据处理到模型评估，帮助开发者高效地训练和评估AI模型。

0

任天堂明星大乱斗AI优势加权回归多GPU加速训练训练游戏AI的开源项目

XAIreason开源项目 – 增强AI推理能力的开源框架

XAIreason是一个专为推理任务设计的开源框架，为开发者提供构建逻辑性强AI系统的工具，通过增强模型的推理能力，支持复杂问题的高效求解。它具备推理引擎、知识整合、模型优化、可视化支持和兼容性强等特点，适用于决策系统、知识问答和透明AI等多种场景。

0

决策系统可视化支持增强AI推理能力开源框架

DiffSinger开源项目 – 开源歌声合成项目

DiffSinger是一个开源的歌声合成项目，由FastSpeech2的作者开发。该项目提供了完整的代码、数据集以及预训练模型，旨在推动歌声合成技术的研究和应用。DiffSinger基于FastSpeech2的歌声合成技术，支持高质量的歌声生成，并且易于扩展和定制，适合用于学术研究、音乐制作和自定义应用开发。

0

学术研究开源歌声合成项目音乐制作高质量歌声生成

EmoNet开源项目 – 多模态情感分析模型

EmoNet是一款结合文本、语音和图像的多模态情感分析模型，能够识别人类的情绪状态。它通过深度学习技术，将语音语调、面部表情和文本内容综合分析，提升情感识别的准确率。EmoNet适用于客户服务、心理健康监测、人机交互等场景，让AI更具人性化。

0

多模态情感分析心理健康监测情感识别智能客服

pytest-memray开源项目 – Python内存分析工具

pytest-memray 是一个用于Python应用程序的内存分析工具，与pytest集成，便于进行内存测试。它提供详细的内存使用报告，支持跟踪内存分配和释放，能够识别内存泄漏，并与多种Python版本兼容。

0

pytest集成Python内存分析工具内存使用报告内存泄漏检测

Lit-GPT开源项目 – 可定制的开源大型语言模型实现

Lit-GPT是一个基于nanoGPT的开源大型语言模型的可定制实现，支持多种先进技术，如Flash Attention 2、4-bit和8-bit量化、LoRA和LLaMA-Adapter微调以及预训练。该项目采用Apache 2.0许可证，支持Llama2、Mistral和Mixtral等模型，旨在提供灵活且高效的模型定制和优化方案。

0

Flash Attention 2可定制实现开源大型语言模型微调

MUSE开源项目 – Facebook开源的多语言词向量库

MUSE是Facebook开源的多语言无监督/有监督词向量库，基于PyTorch和Faiss实现。它支持生成多语言词向量，并提供无监督和有监督的嵌入方法。MUSE易于扩展和定制，集成Faiss库以支持高效的相似性搜索，适用于跨语言任务，如机器翻译和跨语言信息检索。

0

多语言词向量库机器翻译跨语言任务跨语言信息检索

OpenVINO Model Server开源项目 – 英特尔优化的推理模型服务器

OpenVINO Model Server 是一个基于英特尔性能优化的推理模型服务器实现，支持 TensorFlow Serving API。它专为高效、高性能的模型推理服务而设计，能够与 OpenVINO 工具包无缝集成，提供可扩展且高效的模型部署解决方案。

0

OpenVINO Model ServerTensorFlow Serving API模型部署解决方案英特尔优化的推理模型服务器

Codex开源项目 – AI代码生成与优化模型

Codex是OpenAI推出的AI代码生成与优化模型，能够理解自然语言指令，自动编写、优化和补全代码。它支持多种编程语言，并能根据代码上下文提供智能建议，适用于代码生成、错误修复、性能优化等场景。

0

AI代码优化AI代码生成Bug自动修复代码性能优化

LMW-tree开源项目 – 并行流标记EM-tree聚类算法

LMW-tree是一种并行流标记EM-tree聚类算法，专为网络级规模的应用设计。它能够高效处理大规模数据流，并支持实时数据聚类，适用于需要高效处理数据流的应用场景。

0

大规模数据流处理实时数据聚类并行流标记EM-tree聚类算法网络级规模应用

Obsidian Memos开源项目 – 仿Flomo的Obsidian速记插件

Obsidian Memos 是一个专为 Obsidian 用户设计的速记插件，仿照 Flomo 的简洁界面，提供高效的速记体验。它不仅支持快速创建和管理速记，还通过标签分类、快捷键操作等功能，帮助用户更好地组织和回顾内容。与 Obsidian 深度集成，用户可以无缝切换速记和其他笔记，提升工作效率。此外，插件还提供中文文档，方便中文用户使用。

0

Flomo仿制Obsidian插件中文文档笔记管理

PyStore开源项目 – 高效存储Pandas时间序列数据

PyStore是一个专门为Pandas时间序列数据设计的高效存储解决方案。它提供了快速的数据存储和检索功能，支持高性能的数据操作，并且能够处理大规模数据集。PyStore与Pandas无缝集成，提供了一个简单直观的API，使得用户能够轻松地在各种应用场景中使用它。

0

Pandas时间序列数据存储大规模数据集处理机器学习时间序列分析金融时间序列数据管理

Reffix开源项目 – BibTeX引用修复工具

Reffix是一款专为计算机科学论文设计的工具，利用DBLP API修复BibTeX引用列表。它能够自动补全引用中的缺失信息，并用已发表版本替换预印本，同时保持引用标题的大小写格式。

0

BibTeX引用修复工具DBLP API引用列表修复计算机科学论文

unitree_rl_gym开源项目 – Unitree机器人强化学习模拟平台

unitree_rl_gym是一个专为Unitree机器人设计的强化学习模拟训练平台。它支持多种Unitree机器人模型，提供丰富的训练和演示脚本，旨在帮助研究人员和开发者进行机器人学习和研究。该平台为强化学习算法提供了一个高度可配置的环境，使得用户能够轻松地进行模型训练、测试和结果展示。