ptx vinci - 搜索

约 242,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://zhuanlan.zhihu.com
快速了解DeepSeek中用到的PTX - 知乎 - 知乎专栏
2025年1月29日 · PTX即Parallel Thread Execution，属于一种low-level的虚拟机 (VM)和指令集 (ISA)，有专门的几百页的pdf文档 (比如ptx_isa_8.2.pdf)。在PTX中也将CUDA block称作 CTA (Cooperative Thread Array)。基于C/C++的CUDA程序经过编译后可以生成PTX指令，然后通过PTX-to-GPU translator & driver让GPU以并行计算的方式执行这些指令。
xueqiu.com
https://xueqiu.com
通俗解读:【deepseek如何利用PTX编程优化算法提高效率】技术本 …
2025年1月30日 · 他们不满足于现成的操作界面（CUDA），直接改写最底层的机器语言（PTX），让2048块GPU像精密钟表般协同工作。普通AI训练就像用家用轿车送货，DeepSeek则把车改装成赛车：拆掉后排座椅→腾出20%计算单元专管数据传输加装氮气加速→双流水线让计算速度翻倍定制变速器→寄存器优化减少37%能量浪费典型案例：在H800 GPU的132个流处理器中，划出20个专用通信单元。这相当于：传统方案：所有工人既要做计算又要传数据（效率损 …
zhihu.com
https://zhuanlan.zhihu.com
银河系CUDA编程指南(2.5)——NVCC与PTX - 知乎 - 知乎专栏
PTX是一个稳定的编程模型和指令集，是Virtual Architecture的汇编产物，这个ISA能够跨越多种GPU，并且能够优化代码的编译等等。而Real Architecture提供的是真实GPU上的指令集，也是最终CUDA程序运行的指令集SASS。
zhihu.com
https://zhuanlan.zhihu.com
DeepSeek优化PTX，AI挑战CUDA生态？英伟达护城河仍稳固吗？
DeepSeek 直接操作 PTX（Parallel Thread Execution）代码，而不是使用 CUDA 高级 API。 PTX 是英伟达 GPU 计算架构中的中间表示层，接近汇编语言，允许对寄存器分配、线程管理、流式处理等进行更细粒度的优化。
csdn.net
https://blog.csdn.net › article › details
PTX 汇编代码语法 - CSDN博客
2024年10月15日 · ptx指令集是用汇编语言风格的语法编写的，nvidia提供了ptx编译器，可以将ptx代码编译成特定gpu架构的机器代码，从而在gpu上执行。 PTX 文件通常用于CUDA开发中的内核函数，它们可以被编译器进一步编译成可直接在GPU上...
csdn.net
https://blog.csdn.net › mingshili › article › details
[CUDA] ptx使用笔记 - CSDN博客
2025年1月15日 · 并行线程执行（Parallel Thread eXecution，PTX）代码是编译后的GPU代码的一种中间形式，它可以再次编译为原生的GPU微码。利用PTX来进行试验，我们可以解决一些在写代码时遇到的不确定问题。
zhihu.com
https://www.zhihu.com › column
CUDA|PTX ISA汇编笔记 - 知乎
SASS是CUDA中对应GPU的机器码的硬件指令集。 CUDA中还有另一个更上层的虚拟指令集PTX（Parallel Thread eXecution）。我大概总结了两者的一些区别和联系：指令集性质：SASS指… 今天聊一下CUDA SASS指令的基本分类。我手边只有一块笔记本的850M，是Maxwell的架构（与Pascal几乎一样）。之前的一段工作对Turing架构用的比较多，研究可能细一些，但现在手边没有Turing的卡可用了。所以这里主要会聊Turing的架构和指令集，顺带包 …
nvidia.cn
https://forums.developer.nvidia.cn › cuda-ptx
CUDA进阶第二篇：巧用PTX - CUDA - NVIDIA 开发者论坛
2016年7月8日 · 尽管除法运算会被翻译成较复杂的ptx指令，但GPU的执行速度非常快，所以为了保证代码的可读性，并不建议在核函数中用位移运算代替乘除运算！希望和大家一起学习，本文大光叔叔原创 http://blog.csdn.net/litdaguang/article/details/50505885
findhao.net
https://findhao.net › easycoding
解读CUDA汇编PTX(一) [翻译] - FindHao
2017年7月4日 · 由于ptx是中间语言，因为寄存器的定义是虚拟的，不一定完全和硬件寄存器是一对一的关系。一组包含N个虚拟寄存器的寄存器组可以用 <N> 的形式来定义，并且可以通过r0, r1, .. , rN-1，r是通过 %r 给寄存器组赋的名字。
zhihu.com
https://zhuanlan.zhihu.com
cuda性能优化笔记: PTX整理一 - 知乎 - 知乎专栏
ptx是一个low-level的并行虚拟机和指令集; 为通用并行编程提供了一套稳定的编程模型和指令集; cuda和c/c++程序生成 PTX 指令，优化后翻译为特定硬件架构的指令; 编程模型 CTA. cooperative thread array, 协作线程组，协作组中的线程可以互相通信，且执行相同的指令
某些结果已被删除
分页
- 1
- 2
- 3
- 4
- 下一页

快速了解DeepSeek中用到的PTX - 知乎 - 知乎专栏

通俗解读:【deepseek如何利用PTX编程优化算法提高效率】技术本 …

银河系CUDA编程指南(2.5)——NVCC与PTX - 知乎 - 知乎专栏

DeepSeek优化PTX，AI挑战CUDA生态？英伟达护城河仍稳固吗？

PTX 汇编代码语法 - CSDN博客

[CUDA] ptx使用笔记 - CSDN博客

CUDA|PTX ISA汇编笔记 - 知乎

CUDA进阶第二篇：巧用PTX - CUDA - NVIDIA 开发者论坛

解读CUDA汇编PTX(一) [翻译] - FindHao

cuda性能优化笔记: PTX整理一 - 知乎 - 知乎专栏