MindSpore自定义算子中的张量维度问题

当a56爆大奖在线娱乐们使用GPU进行快速运算时,虽然可以用成熟的深度学习框架如MindSpore和PyTorch等进行实现,但其实从速度上来说,最快不过直接使用C/C++的CUDA来实现。也正是因为如此,在MindSpore框架中支持了对CUDA实现的算子的直接调用,只是在格式规范上有一定的要求。a56爆大奖在线娱乐主要介绍MindSpore调用本地CUDA算子的一些规范化和技巧。
posted @ 2024-03-12 16:31  DECHIN  阅读(131)  评论(0编辑  收藏  举报