机器之心报道编辑:张倩用 AI 提高 AI 的效率,它们就能变得像人类大脑一样高效?我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小?日本 AI 初创公司 Sakana ...
最近,关于DeepSeek是否能够绕开英伟达的CUDA框架的讨论,引发了广泛关注。这个问题的答案,不仅关乎DeepSeek的未来发展,更可能影响中国GPU产业能否在全球AI竞争中占有一席之地。英伟达的CUDA技术几乎垄断了全球的AI计算市场,国产GP ...
DeepSeek的尝试虽然引发了人们的希望,其技术路径究竟能否真正打破英伟达的技术封锁,则充满了未知。实际上,DeepSeek并没有完全脱离CUDA,而是选择了绕过CUDA的高层API,直接操作PTX(Parallel Thread ...
在如此迅速发展的人工智能领域,深度学习的算力支持愈发重要。近期,DeepSeek这一技术平台在尝试绕开英伟达的CUDA框架方面引发了广泛关注。这一挑战不仅代表了国产GPU产业对高壁垒技术的追求,也可能成为未来国际竞争的重要棋子。这一事件揭示了中国在全 ...
PhysX 技术在 64 位应用中仍然可以正常使用,例如在《蝙蝠侠:阿卡姆骑士》中,这表明英伟达并未完全放弃 PhysX 技术。但该公司确实已经停止了 RTX 50 系列显卡对 32 位 CUDA 的支持,未来可能还会进一步扩展这一决定。由于 ...
Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」!它能将PyTorch代码自动转换为高度优化的CUDA内核,速度比PyTorch原生实现快10-100倍。
据介绍,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000 GB/s 的内存带宽 &580 TFLOPS 的计算性能。”DeepSeek说。
IT之家 2 月 23 日消息,英伟达在其最新的 RTX 50 系列(Blackwell)显卡中停止了对 32 位 CUDA 应用的支持,多年来,对 PhysX 技术的支持也在逐渐减少。YouTube 博主 VerbalSilence 和一位 ...
英伟达在其最新的RTX 50系列显卡中做出了一项重大调整,这一变化引起了游戏玩家和硬件爱好者的广泛关注。据最新消息,RTX ...
智东西 作者|程茜 编辑|心缘 智东西2月24日报道,刚刚,DeepSeek开源周第一天重磅更新来了,开源首个代码库——FlashMLA,发布一小时GitHub Star数冲上1700。 FlashMLA指的是DeepSeek针对Hopper ...
快科技2月23日消息,日前,NVIDIA悄然放弃了RTX 50系列显卡对32位CUDA的支持,也就不再支持32位Physx物理加速,这一技术历经20多年终于要消失了。 值得一提的是,理论上,NVIDIA仍然支持64位PhysX,但相应的游戏极少,只有 ...
【华泰证券:DeepSeek有望加快模型训练与CUDA的解耦进程】华泰证券研究指出,DeepSeek在V3中运用了相较CUDA更为底层的PTX来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间发挥着桥梁作用。而NSA则采用了O ...