AI to Data 是一个由人工智能驱动的数据生成器,允许用户为任何用例生成真实数据。它采用先进的AI技术生成可靠和安全的数据。用户只需注册或登录平台,提供自然语言查询以指定所需数据类型和行数,系统将生成请求的数据,用户可以以CSV文件格式下载。
SynthMoCap是一个无需标记的全息动作捕捉项目,提供合成数据集,支持身体、面部和手部数据,适用于动作捕捉研究,结合了最新的计算机图形学技术。
Grid.ai是一个专注于机器学习的平台,旨在使最先进的AI研究民主化,而不是关注基础设施。用户可以通过注册网站并参考提供的文档和教程来使用Grid.ai。
Einblick AI 是一个AI原生的笔记本,能够自动编写和修复代码,绘制美丽的图表,构建模型等。用户只需提供提示,Einblick的AI代理便能使用Python、SQL和交互组件构建工作流。
包含10万个压缩驾驶视频的数据集,用于机器学习研究,可用于GPT视频预测模型的实验,还包含编码器/解码器和视频预测模型示例
viser是一个用于Python的交互式3D可视化库,旨在为数据科学和机器学习提供易于使用的工具,通过多种3D图形类型展示数据。它能够与Jupyter Notebook无缝集成,支持用户创建动态的三维模型,展示算法效果。
2000 Hugging Face Prompts 是一份全面的资源,旨在帮助爱好者学习和实验 Hugging Face,使他们熟悉其在不同背景下的功能和应用。
LLaVA-CoT是第一个能够进行自发、系统推理的视觉语言模型,类似于GPT-01,具有强大的多模式处理能力。该模型通过11B参数的强大架构,支持复杂的视觉语言任务,并在多模式基准测试中表现优于多个现有模型。
IEPile是一个用于训练和评估信息提取模型的大规模信息提取语料库,提供高质量的标注数据,支持多种信息提取任务,适用于学术研究和工业应用。
No-Code AI Toolkit 是一个综合性的工具包,使得用户无需编写代码即可轻松启动和推进他们的AI项目,适合个人和团队使用。
这个开源项目的功能主要是利用ChatGPT技术来构建Kedro机器学习管道和Streamlit前端。
该项目提供了多种梯度下降算法的实现,旨在高效优化机器学习模型的训练过程。
该项目旨在通过文本生成多样化和自然的3D人类动作,提供了一种新的方式来创建动画角色的运动表现。
LLM-Tuning 是一个专注于简化大语言模型(LLM)微调过程的工具,支持多种模型与数据集,旨在帮助用户轻松实现模型训练与评估。
Magnetron是自制的迷你版PyTorch,从零开始构建,旨在提供一个简单而强大的深度学习框架,适合研究和生产使用。它的设计初衷是帮助用户更好地理解深度学习的基本原理,并在此基础上进行模型的构建与训练。
Python机器学习库
大规模开源的遥感图像地质灾害点变化检测数据集,包含17对时变超高分辨率遥感图像,分辨率0.59m,采集自谷歌地球服务。总覆盖面积163.77平方公里,图像来自不同地理位置、时间、地表类型的地质灾害点,具有丰富的光谱异质性。
MosaicML 提供的示例项目,旨在帮助用户更好地理解和使用其机器学习工具和框架。该项目包含多种模型训练示例,特别是针对大型语言模型(LLM)的应用。通过高效的资源管理和优化建议,集成了 FSDP(Fully Sharded Data Parallel)以提升训练性能,并提供详细的文档和使用指南,方便开发者快速上手。