今早9点30,国内著名开源大模型平台DeepSeek开启了本周连续5天技术分享的第1天,开源了针对Hopper GPU优化的高效MLA解码内核——FlashMLA。
白交 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek开源周第一天,降本大法公开—— FlashMLA,直接突破H800计算上限。 网友:这怎么可能?? 它是为Hopper GPU开发的高效MLA解码内核,专门针对可变长度序列进行了优化 ...
现在英伟达是自己硬核,而美股在拖累他。永远不要小看垄断的实体产业,技术上干不掉它,就不要指望它崩盘。