网站地图官方微信:
网站首页 高寺镇 雎水镇 黄板乡 董马乡 青化镇 牛场

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么字节跳动的软件选择用Rust这个语言写? |

    飞书应该是使用web技术做ui 用rust做底层的库 给ui...

    查看详情>>
  • | 真的有这种又苗条身材又爆炸的么? |

  • | 慈禧为什么要反对戊戌变法? |

  • | 想初尝苹果Mac电脑,纯体验,选 Macbook air 还是 pro? |

  • | 如何看待 Rust 的应用前景? |

  • | “哨兵模式”涉嫌泄密,你支持封杀特斯拉吗? |

  • | 055驱逐舰 是个什么概念? |

  • | Cloudflare是一家什么样的公司? |

  • | 在NAS上安装了什么应用,让你的生活体验有了巨大的提升? |

  • | 眼睛有飞蚊症可以自愈吗? |

  • | 扫黑风暴为什么他们费老大劲杀这么多人不如直接把督导组干掉? |

  • 阿里云市场份额最大,稳居第一,产品和技术都是最稳定的,私企用...

    2025-06-20
  • 第一个概念, 便宜,055造价每吨60万,万吨60亿人民币,...

    2025-06-20
  • “仙女下嫁凡人”的设定在今天也能找到对照,比如孔雀女下嫁凤凰...

    2025-06-20
  • 听歌不用会员 畅听全网歌曲 GitHub超火的开源软件 音流...

    2025-06-20

关注我们

添加微信好友,关注最新动态