Lyrics To Song AI是一款免费的AI歌曲生成器,能够将歌词转化为专业级别的歌曲。用户只需注册账号,描述音乐愿景,AI即可生成多种歌曲选项。
AI文档理解相关文献资源列表,专注于文档人工智能(Document Artificial Intelligence)领域。该项目收集了大量关于文档理解的研究文献和资源,涵盖了文档人工智能的多个子领域,如OCR、文本分析、图像处理等。持续更新,保持与最新研究进展同步,提供了丰富的参考资料和工具链接,适合研究人员、开发者和学生使用。
OSUM是西北工业大学开源的一个语音理解模型,支持8种语音理解任务,涵盖从语音识别到情感识别,以及语音到文本的深度理解。它结合了Whisper和Qwen2,采用ASR+X训练策略,支持多任务同时训练优化,适用于多种语音处理场景。
Embedding Propagation 是一种旨在为小样本分类创建更平滑流形的方法,通过改进嵌入传播技术来增强模型在有限标注数据下的泛化能力。它适用于多种小样本分类框架,能够有效提升模型在低数据环境下的表现,并为下游任务提供更优质的特征嵌入。
该项目是一个机器学习教程的Notebooks集合,包含混合密度网络(MDN)等教程,旨在帮助用户理解和实践机器学习中的复杂概念。通过丰富的代码示例和详细解释,该项目适合初学者和进阶用户,能够作为学习、研究和开发机器学习算法的资源。
DeepSeek-671B-SFT-Guide 是一个开源的全参数微调指南,提供了 DeepSeek V3/R1 671B 模型的训练和推理代码,并包含了实践中的经验和结论。该项目旨在帮助开发者更好地理解和应用超大规模模型的微调技术,提供从训练到推理的完整解决方案。
Kolmogorov-Arnold Q-Network (KAQN) 是一个将Kolmogorov-Arnold Network (KAN) 应用于强化学习领域的项目,旨在通过结合Q-Network和KAN的原理,探索其在强化学习任务中的有效性。该项目目前处于初步实验阶段,目标是研究和开发新的强化学习算法。
这是一个非常通用且功能丰富的模板,专为快速且可扩展的机器学习实验流程设计。它集成了PyTorch Lightning、Hydra、Optuna和Weights & Biases,能够显著提升深度学习工作流的效率,并提供灵活的配置管理、超参数优化、实验跟踪与可视化等功能。
该项目使用Python和NLTK库,通过自然语言处理技术从公共Twitter流中实时检测并提取符合俳句格式的推文。它利用CMU发音词典进行音节分析,确保提取的推文符合俳句的5-7-5音节结构。项目适用于实时监控、教学示例、数据集生成和社交媒体内容分析等多种场景。
L1 是一个利用强化学习技术来控制推理模型思考时间的项目,旨在提高AI推理的效率。通过动态调整推理时长,L1能够优化模型在不同任务中的表现,同时支持多种数据集和模型训练。项目还提供了预训练模型,方便用户快速集成到现有AI系统中。
TimeSeries_fastai 是 Thomas Capelle 基于 fastai 框架实现的时间序列分类项目。该项目整合了多种时间序列分类算法,支持多篇最新的时间序列分类论文,并能够轻松与 fastai 的深度学习框架集成。项目具有高度可定制性和扩展性,适用于不同的时间序列数据集,并在性能上进行了优化。
L1: Tensor Studio 是一个基于 TensorFlow.js 的张量计算实验平台,提供了一个交互式的环境,用户可以在网页浏览器中进行张量操作和实验。该平台支持可微分的线性代数运算,并利用 TensorFlow.js 进行高效的张量操作。L1: Tensor Studio 旨在帮助用户学习、实践和可视化张量计算及其结果,同时也可用于开发和测试基于张量的机器学习算法。
HumanoidVerse是一个多模拟器框架,专注于人形机器人的仿真到现实学习。它支持多种模拟器,如IsaacGym、IsaacSim和Genesis,允许灵活切换。该框架提供多种人形机器人模型,自由度从10DoF到23DoF不等,能够实现无缝的Sim2Sim和Sim2Real转移,加速人形机器人的部署。
interesting-python是一个集成了Python爬虫、数据分析、机器学习和深度学习的小项目集合。该项目旨在通过实际案例帮助用户学习和实践Python在数据抓取、处理、分析以及高级算法应用中的各种技术。
该项目提供了一套用于下载和加载脑部肿瘤MRI数据集的Python工具,包含2D切片、肿瘤掩码和肿瘤分类数据,适用于医学影像分析、机器学习模型训练与测试、脑部肿瘤检测算法的研究与开发、医学影像数据集的预处理以及教育和学术研究。
Instella是AMD推出的开源高性能语言模型,旨在为开源AI研究和应用提供强大支持。该项目基于AMD Instinct™ MI300X GPU进行训练,充分利用硬件优势,提供卓越的性能和完全开源的模型权重、训练代码及数据。
Paints-UNDO 是一个多功能的AI项目,能够伪造从草稿到成图的完整延时绘画过程,并以视频格式输出。同时,它也能逆向工作,分解图像并展示艺术家可能采取的创作步骤。该项目基于videocrafter2生成视频模型的微调,支持多种风格如二次元、写实风格以及真实照片的伪造和分解。
Latent Dictionary 是一种创新的字典工具,它通过展示词汇在嵌入空间中相对于同义词/反义词的位置,而非提供传统定义,来帮助用户理解词汇之间的关系。该项目利用 DistilBert 模型生成词嵌入,并通过交互式 3D 地图可视化词汇位置,提供独特的视角来观察词汇之间的相对位置。
Overchat AI是一款集成多种先进AI模型的全能超级应用,适用于写作、聊天和任务管理。用户只需输入问题或任务,Overchat AI即可利用其AI模型提供个性化响应。
该项目通过一系列算术问题测试GPT-NeoX-20B的算术能力,旨在深入分析模型在算术任务中的表现,包括准确性和错误模式,并提供详细的分析报告。该项目开源,可通过GitHub Gist访问。
GAOKAO-bench 是一个评估框架,使用中国高考题目作为数据集,用于评估大语言模型的表现。该框架包含多种题型,旨在全面测试模型的语言理解能力和逻辑推理能力。
ViT Prisma是一个专门用于Vision Transformers(ViTs)的机制解释库,旨在帮助用户深入理解ViT模型的内部工作机制。它提供了一系列工具和方法,用于分析Transformer层和注意力机制,支持模型决策的可视化,并促进视觉任务中特征重要性的探索。
Sketch-of-Thought (SoT) 是一种为语言模型推理提供高效、简洁解决方案的工具。它支持多种语言和自适应推理范式,能够自动选择最优推理方式,无需手动调整。SoT 适用于多种自然语言处理任务,并在多语言环境下表现出色。
maçarico是一个基于PyTorch实现的命令式学习搜索框架,专为需要搜索和优化的机器学习任务设计。它支持命令式编程风格,提供灵活的搜索策略配置,易于扩展和自定义,并具有高效的学习和推理过程。
kan-gpt是一个结合Kolmogorov-Arnold Networks(KAN)特性的GPT模型,使用PyTorch框架实现。该项目在Tiny Shakespeare数据集上进行了训练和测试,表现优于传统的MLP-GPT模型。作为一个开源项目,kan-gpt不仅便于社区贡献和进一步研究,还为自然语言处理任务提供了新的解决方案。
该项目是一个关于大型语言模型和基础模型在时态数据(时间序列、时空和事件数据)以及AIOps领域应用的资源列表。它提供了全面的资源,包括论文、代码、数据集等,系统地总结了该领域的最新进展,为研究者和开发者提供了可靠的参考。
MM-EUREKA是一个探索视觉‘顿悟时刻’的多模态强化学习项目,首次将基于规则的强化学习应用于多模态推理,实现文本和视觉信息的高效融合。该项目无需监督微调,通过规则化训练显著提升模型推理能力,并开源完整训练流程,包括代码、模型和数据,助力研究者快速上手。
GlowPro是一款个人AI护肤专家应用,提供专业的皮肤分析和定制护肤建议。用户可以通过扫描皮肤,获得个性化的护理建议,并随着时间的推移跟踪皮肤进展,从而高效地提升护肤体验。该应用适用于iOS和Android设备,旨在通过AI技术帮助用户轻松实现美容目标。
MUSE是Facebook开源的多语言无监督/有监督词向量库,基于PyTorch和Faiss实现。它支持生成多语言词向量,并提供无监督和有监督的嵌入方法。MUSE易于扩展和定制,集成Faiss库以支持高效的相似性搜索,适用于跨语言任务,如机器翻译和跨语言信息检索。
unitree_rl_gym是一个专为Unitree机器人设计的强化学习模拟训练平台。它支持多种Unitree机器人模型,提供丰富的训练和演示脚本,旨在帮助研究人员和开发者进行机器人学习和研究。该平台为强化学习算法提供了一个高度可配置的环境,使得用户能够轻松地进行模型训练、测试和结果展示。