所有AI工具AI开发框架
Tenstorrent官网 – AI硬件与开源软件解决方案
Tenstorrent是一家专注于AI硬件和软件解决方案的下一代计算公司,其旗舰产品Blackhole™芯片专为高效处理大规模AI工作负载设计。公司采用开源策略,提供包括TT-Forge™编译器在内的...
标签:AI开发框架AI硬件解决方案 Blackhole芯片 TT-Forge编译器 开源软件栈 深度学习优化AI交流(进群备注:Tenstorrent)

Tenstorrent是一家专注于AI硬件和软件解决方案的下一代计算公司,其旗舰产品Blackhole™芯片专为高效处理大规模AI工作负载设计。公司采用开源策略,提供包括TT-Forge™编译器在内的软件栈,优化硬件工作负载并与AI软件库集成。Tenstorrent在全球设有多个办事处,汇聚了计算机架构、ASIC设计等领域的顶尖人才。2025年D轮融资6.93亿美元,估值达27亿美元。
Tenstorrent的特点:
- 1. 开源软件栈,无专有障碍
- 2. 高性能Blackhole™芯片,专为AI工作负载优化
- 3. 全球分布,汇聚顶尖人才
- 4. 开发者友好的TT-Forge™编译器,基于MLIR
- 5. 支持大规模AI模型的训练和推理
- 6. 提供AI软件库,增强开发者体验
- 7. 社区支持,包括教程和事件
Tenstorrent的功能:
- 1. 利用Blackhole™芯片和TT-Forge™编译器优化深度学习模型性能
- 2. 部署台式工作站和机架式服务器,适用于各种AI应用场景
- 3. 通过开源平台访问资源,参与社区活动
- 4. 开发和测试AI模型,特别适用于深度学习和生成AI应用
- 5. 提交问题或参与社区活动,获取支持和更新
相关导航

CUTLASS开源项目 – 高性能CUDA矩阵计算库
CUTLASS 是由 NVIDIA 开发的 CUDA C++ 模板库,专注于实现高性能的矩阵乘法 (GEMM) 和相关计算。它通过模块化的 C++ 模板类,为 CUDA 环境下的各种规模的计算提供了灵活且可重用的组件。CUTLASS 采用分层分解和数据移动策略,类似于 cuBLAS 和 cuDNN 的实现方式。最新版本 3.8 带来了对 NVIDIA Blackwell SM100 架构的全面支持,并引入了多项性能优化和新特性。CUTLASS 支持多种数据类型和精度,包括 FP64、FP32、TF32、FP16、BF16、8b 浮点类型、块缩放数据类型和窄整数类型等。它还通过隐式 GEMM 算法实现高性能卷积,并针对 NVIDIA 的 Tensor Core 进行了优化。
暂无评论...