AI学习网站 | 第 18 页

Lyrics To Song AI是一款免费的AI歌曲生成器，能够将歌词转化为专业级别的歌曲。用户只需注册账号，描述音乐愿景，AI即可生成多种歌曲选项。

Awesome-Document-Understanding开源项目 – 文档理解研究资源库

AI文档理解相关文献资源列表，专注于文档人工智能（Document Artificial Intelligence）领域。该项目收集了大量关于文档理解的研究文献和资源，涵盖了文档人工智能的多个子领域，如OCR、文本分析、图像处理等。持续更新，保持与最新研究进展同步，提供了丰富的参考资料和工具链接，适合研究人员、开发者和学生使用。

0

OCR图像处理文本分析文档理解

OSUM开源项目 – 多功能语音理解模型

OSUM是西北工业大学开源的一个语音理解模型，支持8种语音理解任务，涵盖从语音识别到情感识别，以及语音到文本的深度理解。它结合了Whisper和Qwen2，采用ASR+X训练策略，支持多任务同时训练优化，适用于多种语音处理场景。

0

多任务训练开源项目情感识别语音理解模型

Embedding Propagation开源项目 – 提升小样本分类的泛化能力

Embedding Propagation 是一种旨在为小样本分类创建更平滑流形的方法，通过改进嵌入传播技术来增强模型在有限标注数据下的泛化能力。它适用于多种小样本分类框架，能够有效提升模型在低数据环境下的表现，并为下游任务提供更优质的特征嵌入。

0

小样本分类嵌入传播技术流形学习特征嵌入

ML-Tutorial-Notebooks开源项目 – 机器学习教程Notebooks集合

该项目是一个机器学习教程的Notebooks集合，包含混合密度网络(MDN)等教程，旨在帮助用户理解和实践机器学习中的复杂概念。通过丰富的代码示例和详细解释，该项目适合初学者和进阶用户，能够作为学习、研究和开发机器学习算法的资源。

0

Notebooks集合TensorFlow机器学习教程混合密度网络

DeepSeek-671B-SFT-Guide开源项目 – DeepSeek 671B模型全参数微调指南

DeepSeek-671B-SFT-Guide 是一个开源的全参数微调指南，提供了 DeepSeek V3/R1 671B 模型的训练和推理代码，并包含了实践中的经验和结论。该项目旨在帮助开发者更好地理解和应用超大规模模型的微调技术，提供从训练到推理的完整解决方案。

0

全参数微调指南推理代码训练优化超大规模模型

Kolmogorov-Arnold Q-Network (KAQN)开源项目 – 将KAN应用于强化学习的初步实验

Kolmogorov-Arnold Q-Network (KAQN) 是一个将Kolmogorov-Arnold Network (KAN) 应用于强化学习领域的项目，旨在通过结合Q-Network和KAN的原理，探索其在强化学习任务中的有效性。该项目目前处于初步实验阶段，目标是研究和开发新的强化学习算法。

0

Kolmogorov-Arnold NetworkQ-Network开源项目强化学习

PyTorch Lightning + Hydra Template开源项目 – 机器学习实验模板

这是一个非常通用且功能丰富的模板，专为快速且可扩展的机器学习实验流程设计。它集成了PyTorch Lightning、Hydra、Optuna和Weights & Biases，能够显著提升深度学习工作流的效率，并提供灵活的配置管理、超参数优化、实验跟踪与可视化等功能。

0

HydraOptunaPytorch LightningWeights & Biases

Find Haikus in Twitter Stream开源项目 – 从Twitter流中实时发现俳句

该项目使用Python和NLTK库，通过自然语言处理技术从公共Twitter流中实时检测并提取符合俳句格式的推文。它利用CMU发音词典进行音节分析，确保提取的推文符合俳句的5-7-5音节结构。项目适用于实时监控、教学示例、数据集生成和社交媒体内容分析等多种场景。

0

NLTK库Python项目Twitter流分析俳句检测

L1开源项目 – 用强化学习优化AI推理时间

L1 是一个利用强化学习技术来控制推理模型思考时间的项目，旨在提高AI推理的效率。通过动态调整推理时长，L1能够优化模型在不同任务中的表现，同时支持多种数据集和模型训练。项目还提供了预训练模型，方便用户快速集成到现有AI系统中。

0

AI推理优化开源项目强化学习预训练模型

TimeSeries_fastai开源项目 – 基于fastai的时间序列分类实现

TimeSeries_fastai 是 Thomas Capelle 基于 fastai 框架实现的时间序列分类项目。该项目整合了多种时间序列分类算法，支持多篇最新的时间序列分类论文，并能够轻松与 fastai 的深度学习框架集成。项目具有高度可定制性和扩展性，适用于不同的时间序列数据集，并在性能上进行了优化。

0

fastai框架开源项目时间序列分类深度学习

L1: Tensor Studio开源项目 – 基于TensorFlow.js的张量计算平台

L1: Tensor Studio 是一个基于 TensorFlow.js 的张量计算实验平台，提供了一个交互式的环境，用户可以在网页浏览器中进行张量操作和实验。该平台支持可微分的线性代数运算，并利用 TensorFlow.js 进行高效的张量操作。L1: Tensor Studio 旨在帮助用户学习、实践和可视化张量计算及其结果，同时也可用于开发和测试基于张量的机器学习算法。

0

TensorFlow.js交互式学习平台张量计算机器学习算法

HumanoidVerse开源项目 – 多模拟器人形机器人学习框架

HumanoidVerse是一个多模拟器框架，专注于人形机器人的仿真到现实学习。它支持多种模拟器，如IsaacGym、IsaacSim和Genesis，允许灵活切换。该框架提供多种人形机器人模型，自由度从10DoF到23DoF不等，能够实现无缝的Sim2Sim和Sim2Real转移，加速人形机器人的部署。

0

Sim2Real转移Sim2Sim转移人形机器人仿真多模拟器框架

interesting-python开源项目 – Python爬虫与数据分析项目

interesting-python是一个集成了Python爬虫、数据分析、机器学习和深度学习的小项目集合。该项目旨在通过实际案例帮助用户学习和实践Python在数据抓取、处理、分析以及高级算法应用中的各种技术。

0

Python爬虫数据分析机器学习深度学习

brain-tumor-mri-dataset开源项目 – 脑部肿瘤MRI数据集工具

该项目提供了一套用于下载和加载脑部肿瘤MRI数据集的Python工具，包含2D切片、肿瘤掩码和肿瘤分类数据，适用于医学影像分析、机器学习模型训练与测试、脑部肿瘤检测算法的研究与开发、医学影像数据集的预处理以及教育和学术研究。

0

医学影像分析医学影像数据集预处理机器学习模型训练脑部肿瘤MRI数据集工具

Instella开源项目 – AMD开源高性能语言模型

Instella是AMD推出的开源高性能语言模型，旨在为开源AI研究和应用提供强大支持。该项目基于AMD Instinct™ MI300X GPU进行训练，充分利用硬件优势，提供卓越的性能和完全开源的模型权重、训练代码及数据。

0

AMD Instinct MI300X开源语言模型自然语言处理高性能计算

Paints-UNDO开源项目 – 伪造与逆向绘画过程的AI工具

Paints-UNDO 是一个多功能的AI项目，能够伪造从草稿到成图的完整延时绘画过程，并以视频格式输出。同时，它也能逆向工作，分解图像并展示艺术家可能采取的创作步骤。该项目基于videocrafter2生成视频模型的微调，支持多种风格如二次元、写实风格以及真实照片的伪造和分解。

0

AI绘画工具伪造延时绘画绘画技巧模拟艺术创作演示

Latent Dictionary开源项目 – 展示词嵌入空间中词汇相对位置的字典

Latent Dictionary 是一种创新的字典工具，它通过展示词汇在嵌入空间中相对于同义词/反义词的位置，而非提供传统定义，来帮助用户理解词汇之间的关系。该项目利用 DistilBert 模型生成词嵌入，并通过交互式 3D 地图可视化词汇位置，提供独特的视角来观察词汇之间的相对位置。

0

DistilBert模型交互式3D地图词嵌入可视化工具词汇关系学习

Overchat官网 – 全能AI超级应用

Overchat AI是一款集成多种先进AI模型的全能超级应用，适用于写作、聊天和任务管理。用户只需输入问题或任务，Overchat AI即可利用其AI模型提供个性化响应。

0

AI写作工具AI聊天助手任务管理AI作业辅助AI

GPT-NeoX-20B 算术能力评估开源项目 – 评估GPT-NeoX-20B的算术能力

该项目通过一系列算术问题测试GPT-NeoX-20B的算术能力，旨在深入分析模型在算术任务中的表现，包括准确性和错误模式，并提供详细的分析报告。该项目开源，可通过GitHub Gist访问。

0

GPT-NeoX-20B开源项目算术能力评估错误模式分析

GAOKAO-bench开源项目 – 利用高考题评估大语言模型的框架

GAOKAO-bench 是一个评估框架，使用中国高考题目作为数据集，用于评估大语言模型的表现。该框架包含多种题型，旨在全面测试模型的语言理解能力和逻辑推理能力。

0

大语言模型评估框架语言理解评估逻辑推理评估高考题数据集

ViT Prisma开源项目 – Vision Transformer机制解释库

ViT Prisma是一个专门用于Vision Transformers（ViTs）的机制解释库，旨在帮助用户深入理解ViT模型的内部工作机制。它提供了一系列工具和方法，用于分析Transformer层和注意力机制，支持模型决策的可视化，并促进视觉任务中特征重要性的探索。

0

Vision Transformer机制解释库模型决策可视化特征重要性探索

Sketch-of-Thought (SoT)开源项目 – 高效语言模型推理解决方案

Sketch-of-Thought (SoT) 是一种为语言模型推理提供高效、简洁解决方案的工具。它支持多种语言和自适应推理范式，能够自动选择最优推理方式，无需手动调整。SoT 适用于多种自然语言处理任务，并在多语言环境下表现出色。

0

多语言支持自动推理选择高效语言模型推理

maçarico开源项目 – PyTorch实现的搜索学习框架

maçarico是一个基于PyTorch实现的命令式学习搜索框架，专为需要搜索和优化的机器学习任务设计。它支持命令式编程风格，提供灵活的搜索策略配置，易于扩展和自定义，并具有高效的学习和推理过程。

0

PyTorch实现的搜索学习框架强化学习机器学习任务优化机器翻译

kan-gpt开源项目 – 结合KAN特性的GPT模型

kan-gpt是一个结合Kolmogorov-Arnold Networks（KAN）特性的GPT模型，使用PyTorch框架实现。该项目在Tiny Shakespeare数据集上进行了训练和测试，表现优于传统的MLP-GPT模型。作为一个开源项目，kan-gpt不仅便于社区贡献和进一步研究，还为自然语言处理任务提供了新的解决方案。

0

GPT模型KAN神经网络PyTorch框架开源项目

Awesome-TimeSeries-AIOps-LM-LLM开源项目 – 时态数据与AIOps资源大全

该项目是一个关于大型语言模型和基础模型在时态数据（时间序列、时空和事件数据）以及AIOps领域应用的资源列表。它提供了全面的资源，包括论文、代码、数据集等，系统地总结了该领域的最新进展，为研究者和开发者提供了可靠的参考。

0

AIOps大型语言模型开源项目时间序列分析

MM-EUREKA开源项目 – 多模态强化学习项目

MM-EUREKA是一个探索视觉‘顿悟时刻’的多模态强化学习项目，首次将基于规则的强化学习应用于多模态推理，实现文本和视觉信息的高效融合。该项目无需监督微调，通过规则化训练显著提升模型推理能力，并开源完整训练流程，包括代码、模型和数据，助力研究者快速上手。

0

AI推理能力提升多模态强化学习开源项目文本和视觉信息融合