毕业设计第四天

花了整整一天,写了一个列Householder向量的生成函数。
AscendC里面的矢量计算接口只支持32B的block运算,且带mask的接口需要8x32B对齐,烦的一匹。
查到服务器上晟腾npu的型号,但是华为文档只写支持服务器/工作站产品xx型号,根本搜不到这个npu对应哪个产品,文档接口适不适配。产品页也是,找不到npu型号标注,无语死了。
除了这个列Householder向量生成 双对角化里还有5-6个差不多同一层次的函数要写。然后BDC过程更是复杂,照这个速度写不完了。
不仅要实现,还要优化。我已经加了十几个限制条件可待改进了,还是这么慢。
论文写不完的话就是延毕,被迫三方违约。前途一片黑暗。
😫
全部评论

相关推荐

评论
2
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务