PTX VinC - 搜索

约 62,700 个结果

在新选项卡中打开链接

时间不限

csdn.net
https://blog.csdn.net › article › details
GPU底层优化的关键语言（深入解析PTX）；PTX相比汇编语言的核心优势_库达下的ptx …
2025年2月18日 · PTX（Parallel Thread Execution）是英伟达GPU架构中的中间指令集架构，介于高级编程语言（如CUDA C++）和底层机器码（SASS）之间。它类似于传统计算机体系中的汇编语言，但抽象层级略高于直接操作硬件的机器码，主要用于实现跨GPU架构的兼容性。。_库达下 …
phirs.com
https://www.phirs.com › archive
超越CUDA的魔法：从DeepSeek看PTX指令的终极优化之道 – Phirs
2025年2月2日 · PTX作为虚拟指令集，允许开发者直接操控GPU的微观架构。DeepSeek团队在R1模型中展现了三大杀手锏：寄存器分配艺术通过手动混合使用32位和64位寄存器，将寄存器压力降低23%。在多头注意力计算中，这种优化使得每个线程块可承载的token数量从512提升 …
xueqiu.com
https://xueqiu.com
通俗解读:【deepseek如何利用PTX编程优化算法提高效率】技术本 …
2025年1月30日 · 技术本质：英伟达 GPU的指令系统分为三层：顶层：CUDA（类似Python）中间层：PTX（类似C语言）底层：SASS（机器码）DeepSeek团队直接操作PTX层，实现了三大突破：寄存器重分配：将每个流处理器的寄存器使用率从78%提升至92%（相当于把4车道公路改造成6车道）线程束重组：通过指令重排使计算单元闲置时间减少40%（类似优化工厂流水线节拍）内存访问优化：将全局内存访问延迟从600周期降至450周期（相当于把仓库到车间的运输时间 …
csdn.net
https://blog.csdn.net › article › details
PTX 汇编代码语法 - CSDN博客
2024年10月15日 · 在CUDA中，可以通过nvcc命令将C++源文件及其相关依赖项编译成PTX代码，然后再将PTX代码交给GPU进行运算。在编译完成 PTX 代码后，我们可以使用CUDA驱动程序API提供的函数将 PTX 代码加载到GPU中，并执行这些代码。
zhihu.com
https://zhuanlan.zhihu.com
Cuda PTX的入门实践-以矩阵乘法为例 - 知乎 - 知乎专栏
本文以矩阵乘法为例，简单介绍如何使用在cuda代码中inline PTX代码，不考虑性能问题。矩阵乘法的C语言代码的naive实现： C = A*B，A的形状为M*K，B为K*N。如何使用内联PTX代码使用上述的功能呢？示例代码如下： asm(".reg .f32 f1, f2, f3;\n" "mov.f32 f1, 0.0;\n" ::); for (int i = 0; i < K; ++i) { // 从全局内存中读取数据到寄存器中，并进行乘法+加法运算.
zhihu.com
https://zhuanlan.zhihu.com
DeepSeek优化PTX，AI挑战CUDA生态？英伟达护城河仍稳固吗？
DeepSeek 直接操作 PTX（Parallel Thread Execution）代码，而不是使用 CUDA 高级 API。 PTX 是英伟达 GPU 计算架构中的中间表示层，接近汇编语言，允许对寄存器分配、线程管理、流式处理等进行更细粒度的优化。
csdn.net
https://blog.csdn.net › article › details
Nvidia Tensor Core-MMA PTX编程入门 - CSDN博客
2024年11月18日 · 在cuda中，可以通过nvcc命令将c++源文件及其相关依赖项编译成ptx代码，然后再将ptx代码交给gpu进行运算。在编译完成ptx代码后，我们可以使用cuda驱动程序api提供的函数将ptx代码加载到gpu中，并执行这些代码。
zhihu.com
https://zhuanlan.zhihu.com
cuda性能优化笔记: PTX整理一 - 知乎 - 知乎专栏
ptx是一个low-level的并行虚拟机和指令集; 为通用并行编程提供了一套稳定的编程模型和指令集; cuda和c/c++程序生成 PTX 指令，优化后翻译为特定硬件架构的指令; 编程模型 CTA. cooperative thread array, 协作线程组，协作组中的线程可以互相通信，且执行相同的指令
zhihu.com
https://www.zhihu.com › question
英伟达PTX编译到SASS的语法树是什么样的？ - 知乎
PTX（Parallel Thread Execution）是一种中间层汇编语言，用于CUDA编程模型。当CUDA源代码被nvcc（NVIDIA CUDA Compiler）编译时，它首先会被编译成PTX代码，然后再从PTX编译成特定GPU架构的SASS（Source Assembly for Streaming Processor）代码。
xueqiu.com
https://xueqiu.com
PTX是否做到绕过CUDA垄断？ - 雪球
2025年2月8日 · 首先解释下ptx。英伟达芯片的顶层应用场景特别广，从游戏图形、自动驾驶、大语言模型到科学模拟，每个领域都得根据具体任务去编程软件库，因为每个领域使用GPU都得靠这些...
某些结果已被删除
分页
- 1
- 2
- 3
- 4
- 下一页

GPU底层优化的关键语言（深入解析PTX）；PTX相比汇编语言的核心优势_库达下的ptx …

超越CUDA的魔法：从DeepSeek看PTX指令的终极优化之道 – Phirs

通俗解读:【deepseek如何利用PTX编程优化算法提高效率】技术本 …

PTX 汇编代码语法 - CSDN博客

Cuda PTX的入门实践-以矩阵乘法为例 - 知乎 - 知乎专栏

DeepSeek优化PTX，AI挑战CUDA生态？英伟达护城河仍稳固吗？

Nvidia Tensor Core-MMA PTX编程入门 - CSDN博客

cuda性能优化笔记: PTX整理一 - 知乎 - 知乎专栏

英伟达PTX编译到SASS的语法树是什么样的？ - 知乎

PTX是否做到绕过CUDA垄断？ - 雪球