标签:内核
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
新智元报道编辑:乔杨 Frey 【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA...
新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性
机器之心报道 编辑:陈陈用 FlexAttention 尝试一种新的注意力模式。理论上,注意力机制就是你所需要的一切。然而在实际操作中,我们还需要优化像 FlashAtten...
微软全球蓝屏致391亿损失!25万台设备仍未恢复
克雷西 发自 凹非寺量子位 | 公众号 QbitAI波及全球的微软蓝屏事件,至今还有25万台设备没完全恢复! 另据估计,崩溃的设备多达850万台,到目前为止已经恢复...
54亿美金蒸发,83岁老人失踪!蓝屏元凶30天崩一个系统,微软急发事故报告
新智元报道编辑:Aeneas 好困 【新智元导读】史上最大规模TI故障,已经为财富500强带来了54亿美元损失,甚至导致一位83岁老人失踪至今未归。如今,微软终于给...
英伟达官宣全面开源GPU内核驱动,两年迭代至最强版本!下一代Blackwell全用开源
新智元报道编辑:庸庸 【新智元导读】英伟达全面转向开源GPU内核模块,历史将再次见证Linux社区开源的力量。英伟达宣布全面转向开源GPU内核模块! 这次开源行...
从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
机器之心报道 编辑:泽南、小舟从学习芯片的基础知识开始。「我花两周时间零经验从头开始构建 GPU,这可比想象的要难多了。」总有人说老黄的芯片供不应求,大...
坏了,我的RTX 3090 GPU在对我唱歌!
机器之心报道 机器之心编辑部这你敢信?! 在一个昏暗的机箱里,一台 RTX 3090 GPU「唱」着经典英语儿歌《一闪一闪亮晶晶》(Twinkle,Twinkle,Little Star)...
下接万卡集群、上连AI原生应用,操作系统的进化超出你的想象
机器之心报道 作者:杜伟从此,操作系统被赋予了新的内核,也让应用开发体验迎来前所未有的新变化。大模型发展至今,还能带给开发者哪些惊喜呢? 在 4 月 16 ...
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
新智元报道编辑:alan 【新智元导读】近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度...
UCLA蒋陈凡夫团队新研究:在VR里控制3D物体,高斯泼溅渲染
白交 发自 凹非寺量子位 | 公众号 QbitAIVision Pro现在玩的太花了,什么时候能快进到沉浸式玩3D游戏?? 现在有个新研究,在VR里实时控制3D高斯泼溅生成的物...
PyTorch 2.2大更新!集成FlashAttention-2,性能提升2倍
新智元报道编辑:alan 【新智元导读】新的一年,PyTorch也迎来了重大更新,PyTorch 2.2集成了FlashAttention-2和AOTInductor等新特性,计算性能翻倍。新的一...
当我们讨论操作系统时,我们该讨论什么?
百舸争流 奋楫者先2024 年的第一个工作日,华为终端 CEO 余承东就在内部全员信中提到: 2024年是原生鸿蒙的关键一年,我们要加快推进各类鸿蒙原生应用的开发...
一条隐形短信让iPhone变“终极监控工具”,附近设备信息都能获取!苹果惊人漏洞历时4年才被发现
丰色 发自 凹非寺量子位 | 公众号 QbitAI苹果重大漏洞让数千部iPhone变“终极监控工具”—— 而且居然过了四年才被发现? 最近,知名安全公司卡巴斯基曝光: 恶意...
12