发表评论取消回复
相关阅读
相关 TVM Compiler中文教程:TVM为NVIDIA GPU自动调优卷积网络
文章目录 TVM为NVIDIA GPU自动调优卷积网络 加载依赖库 定义网络 设置调优选项 开始调优
相关 TVM Compiler中文教程:TVM.Relay使用外部库
文章目录 TVM.Relay使用外部库 创建一个简单的网络 使用cuda后端构建和运行 卷积层使用cuDNN实现
相关 TVM Compiler中文教程:TVM部署SSD模型
部署SSD模型 我们使用GluonCV预训练SSD模型和转换成Relay IR中间表示 import tvm from matplotlib
相关 TVM Compiler中文教程:TVM编译ONNX模型并执行
文章目录 编译ONNX模型 加载预训练ONNX模型 加载一张测试图像 使用relay编译模型 在TVM上执行
相关 TVM Compiler中文教程:TVM调用外部张量函数的三种方法
外部张量函数 虽然TVM支持透明代码生成,但有时将手动编写的代码合并到管道中也很有帮助。例如,我们想去为部分卷积和使用cuDNN和定义其他阶段。 TVM原生支持黑盒函数
相关 TVM Compiler中文教程:TVM使用内联和数学函数
文章目录 TVM使用内联和数学函数 直接声明外部数学函数调用 统一内联函数调用 内部Lowering规则 总结
相关 TVM Compiler中文教程:TVM中Compute和Reduction如何使用元组输入
Compute和Reduction使用元组输入 我们通常希望在单个循环内计算具有相同维度的多个输出,或者,执行涉及argmax等多个值的缩减。 在这篇教程,我们将介绍在
相关 TVM Compiler中文教程:TVM调度原语(Schedule Primitives)
文章目录 TVM调度原语(Schedule Primitives) 分裂split 平铺tile 融合fuse
相关 TVM Compiler中文教程:TVM如何生成优化GPU卷积
文章目录 TVM如何优化GPU卷积 准备和算法 内存层次结构 分块 虚拟线程分裂 并发数据获取
相关 TVM Compiler中文教程:TVM如何优化CPU GEMM(矩阵乘法)
文章目录 TVM如何优化CPU GEMM(矩阵乘法) 准备和基线 Opt1:分块 Opt2:向量化 Opt3:
还没有评论,来说两句吧...