faster
-
斯坦福让”GPU高速运转”的新工具火了,比FlashAttention2更快 | 量子位
西风 2024-06-06 16:32:57 来源:量子位 内核100行代码让H100比使用FA2性能提升30% 西风 发自 凹非寺 量子位 | 公众号 QbitAI AI算力资源…
西风 2024-06-06 16:32:57 来源:量子位 内核100行代码让H100比使用FA2性能提升30% 西风 发自 凹非寺 量子位 | 公众号 QbitAI AI算力资源…