Rembg 是一款开源工具,专注于快速且精确地从图片中移除背景。它支持多种输入输出格式,可以作为命令行工具、库或Docker容器使用。Rembg 提供了多种预训练模型,适用于不同的使用场景,如人像分割、动漫角色分割等。它还支持GPU加速,适用于大规模图像处理任务。
ChatTTS-ui 是一个简单的本地网页界面,支持在网页上将文字合成为语音,支持中英文、数字混杂,并提供API接口。项目支持Windows、Linux、Mac多平台部署,用户可以通过网页界面或API进行文字转语音操作。
docling-api是一个高效、可扩展的文档转换后端服务器,能够轻松将多种文档格式(如PDF、DOCX、PPTX、HTML、图片等)转换为Markdown格式。它支持CPU和GPU处理,尤其在GPU模式下性能显著提升。该API提供同步和异步接口,满足不同场景需求,并支持多语言OCR,覆盖法语、德语、西班牙语等多种语言。此外,它还支持文本和表格提取,以及批量处理功能。
mast3r-slam是一个基于Rerun的MASt3R-SLAM实现,旨在简化实时密集SLAM与3D重建的过程。通过使用Rerun进行可视化,用户可以直观地查看SLAM结果。项目通过Pixi简化了安装过程,用户可以在10分钟内完成复杂依赖的安装。此外,mast3r-slam支持NVIDIA GPU加速,显著提升了性能。
本项目提供详细的教程,指导用户如何在6GB显存的显卡上运行Llama 13B模型。教程包括克隆llama.cpp仓库、安装CUDA、设置micromamba环境、安装必要的Python包、执行模型转换过程以及生成提示文件等步骤。通过优化配置,用户可以在有限的显存资源下高效运行Llama 13B模型。
Cobra智能导航库为移动机器人提供实时的度量-语义映射导航功能,支持在无结构和有结构环境中进行导航。其模块化设计使其易于扩展和定制,兼容ROS(机器人操作系统),并支持CPU和GPU运行,以提高计算效率。
Dynamiqs是一个基于JAX开发的高性能量子系统模拟库,支持GPU加速和可微分计算。它能够模拟薛定谔方程和林德布拉德主方程,适合大规模量子系统的仿真。此外,Dynamiqs还支持基于梯度的参数估计和量子最优控制,为量子系统的研究和优化提供了强大的工具。
HiPixel 是一款专为 macOS 设计的 AI 图像超分辨率工具,基于 Upscayl 开发,提供高效且实用的图像放大功能。该工具专注于提升工作流效率和 macOS 原生体验,支持多种图像格式,并具备 GPU 加速处理能力,确保快速且高质量的图像处理。
MaxDiffusion是一个专注于AI扩散模型的高效实现与优化的项目,旨在为大规模训练和推理提供强大的支持。它支持多种主流扩散模型,并通过优化的TPU和GPU加速显著提升推理速度。此外,项目还引入了Flux LoRA等创新功能,进一步提高了推理效率。
xGeMM是一个从零开始实现的加速型单精度矩阵乘法(FP32)项目,专为GPU优化,旨在显著提升矩阵运算的性能。该项目支持多种优化策略,从简单到高级,通过高效利用CUDA技术,实现性能的大幅提升。xGeMM还提供了详细的基准测试,涵盖多种实现方式,帮助用户理解和比较不同矩阵乘法实现方式的性能差异。
一个专为苹果设备设计的深度学习框架,让深度学习在Apple Silicon上飞速运行。
一个强大的物理引擎与渲染技术结合的项目,能在GPU上高效处理物理模拟和渲染任务,为视觉策略训练提供支持
CoCalc是一个先进的计算工具,提供强大的计算服务器,支持GPU,可用于多种计算任务。
Visage是一个GPU加速的跨平台C++库,专为原生用户界面和2D图形设计。它将UI框架的结构与创意图形库的特性相结合,提供高效且富有艺术感的解决方案。
PyTorch是一个开源的深度学习框架,广泛用于计算机视觉和自然语言处理等领域。
FLUXSwift是FLUX.1模型的Swift实现,利用mlx-swift库在苹果硅芯片上进行GPU加速,旨在高效生成图像。
一个强大高效、低延迟的语音转文本工具,支持状态监测和唤醒词触发。
Kyanite是一个用Rust开发的神经网络推理库,支持CPU和Nvidia GPU,采用模块化设计,能够清晰地分割各个推理阶段,提供高效的内存管理和计算性能。