大佬的矩阵乘法加速 作者: icfg66 时间: 2021-06-28 分类: 算法 评论 感谢这篇博文的分享,原理讲得很清楚。大佬是怎么优雅实现矩阵乘法的? github 源码,核心代码用汇编,"sgemm_kernel_x64_fma.S" 由于之前用过av...
C++多线程2——亲和性 作者: icfg66 时间: 2021-02-08 分类: EDA 评论 一、多核CPU的结构 服务器的多核结构属于NUMA(Non-Uniform Memory Access,非一致性内存访问)架构。这里有一篇很好的介绍NUMA架构理解。 以...