科技领域的派系之争从未休止,各种各样的操作系统、云服务商乃至深度学习框架都有各自的支持者和反对者。几杯小酒下肚,从业人士们总爱拾起话题、挑动争端,搞搞“抛开事实不谈”的娱乐插曲。没错,人们会打心里支持自己喜爱的技术,甚至愿意牺牲 ...
近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。 在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...
11 月 6 日,PyTorch 创始人 Soumith Chintala 宣布将卸任框架负责人,并离开他就职 11 年的 Meta。 11 月 6 日,PyTorch 创始人 Soumith Chintala 宣布将卸任框架负责人,并离开他就职 11 年的 Meta。这标志着全球最受欢迎的开源深度学习框架之一,进入新的领导阶段。 Chintala 在 ...
7项指标排名第一。 JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow,也许未来会有更多的大模型诞生在这个平台上。谷歌在背后的默默付出终于得到了回报。 谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。
近期,一项由Flash Attention联合创作者Tri Dao携手普林斯顿大学两位研究生带来的技术创新,在深度学习界掀起了波澜。他们推出的QuACK内核库,凭借纯Python与CuTe-DSL的结合,在不依赖CUDA C++的情况下,于H100显卡上实现了性能上的飞跃,速度超越了PyTorch的torch.compile和 ...
PyTorch 大牛 Horace He 突然官宣,加盟 Thinking Machines。 「在 Meta,离职时发布一张工牌照片是一种传统。遗憾的是,我找不到我的正式工牌了,所以只能用临时工牌代替」 毕业后,在 Meta 的 PyTorch 工作 4 年后,Horace He 终于决定换一种职业,探索一些新的事物。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果