1. [首页  
](https://developer.nvidia.cn)
2. 
NVIDIA CUDA

# NVIDIA CUDA

CUDA 是 NVIDIA 的加速计算平台，也是 GPU 计算的基础。

下载：

[下载 CUDA 工具包](/cuda-downloads &quot;Download CUDA Toolkit&quot;)

快速链接：

- [文档](https://docs.nvidia.com/cuda/)
- [编程指南](https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html)
- [教程和示例](https://github.com/NVIDIA/accelerated-computing-hub)

- [GPU 支持](/cuda-gpus)
- [论坛](https://forums.developer.nvidia.com/c/accelerated-computing/cuda/206)
- [常见问题解答](/cuda-faq)

## CUDA 入门

 ![NVIDIA CUDA toolkit](https://developer.download.nvidia.com/images/cuda-kv-toolkit-ari.jpg)

### CUDA 工具包

NVIDIA® CUDA® 工具套件提供用于创建高性能 GPU 加速应用程序的开发环境。该工具包包括 GPU 加速库、调试和优化工具、C++ 编译器和运行时库。

[获取 CUDA 开发环境](/cuda-toolkit)

 ![NVIDIA CUDA Python logos](https://developer.download.nvidia.com/images/cuda/cuda-python.jpg)

### CUDA Python

作为当今 AI 和高性能计算 (HPC) 领域最热门的编程语言之一，Python 开发者可以直接在 Python 中构建强大的 GPU 应用程序。

[编写 GPU 驱动的 Python](/cuda-python)

 ![NVIDIA CUDA Tile](https://developer.download.nvidia.com/images/cuda/cuda-tile-1920-1080.jpg)

### CUDA Tile

NVIDIA CUDA Tile 是一种 GPU 编程模型，可简化基于 Tile 的优化内核的创建，并实现特殊用途硬件 (包括 Tensor Core) 的可移植性。

[释放 GPU 峰值性能](/cuda/tile)

 ![NVIDIA Nsight Developer Tools](https://developer.download.nvidia.com/images/cuda/nsight-developer-tools.jpg)

### Nsight 开发者工具

NVIDIA Nsight™ 工具是一套功能强大的库、SDK 和开发者工具，涵盖桌面和移动目标。它们使开发者能够利用最新的加速计算硬件构建、调试、分析和开发软件。

[构建、调试和配置软件](/tools-overview)

 ![NVIDIA CUDA-X Libraries](https://developer.download.nvidia.com/images/cuda/cuda-x-libraries.jpg)

### CUDA-X 库

NVIDIA CUDA-X™ 基于 CUDA 构建，是一系列库的集合，可显著提高跨应用领域 (包括 AI 和 HPC) 的性能。

[使用经过优化的预构建库](/cuda/gpu-accelerated-libraries)

## CUDA 基础知识

[CUDA 编程指南](https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html)

[![NVIDIA CUDA platform for accelerated computing](https://developer.download.nvidia.com/images/cuda/what-is-cuda.svg)](https://developer.download.nvidia.com/images/cuda/what-is-cuda.svg)
_单击“Image” (图像) 放大_

### 什么是 CUDA？

CUDA 是 NVIDIA 的加速计算平台，为应用程序提供利用 GPU 算力的软件层。开发者可以使用 C++、Python、Fortran 等语言编程，或借助如 PyTorch 等 GPU 加速库和框架，将 GPU 计算灵活集成到软件栈的各个层面，以获得更佳的功能与性能表现。  
  
CUDA 平台的重要组成部分之一是 [CUDA Toolkit](/cuda-toolkit)，它提供开发 GPU 应用所需的编译器、库和开发工具。

### CUDA 到底是指什么？  

了解可帮助开发者解决实际挑战的 CUDA 生态系统。

[观看视频](https://www.nvidia.cn/on-demand/session/gtc25-S72571/)

### 学习 CUDA C++

通过一系列指导式 Notebook 学习 CUDA C++ 的基础知识。

[开始学习](https://github.com/NVIDIA/accelerated-computing-hub/tree/main/tutorials/cuda-cpp)

### 学习 CUDA Python

开始使用 Python 进行 GPU 开发，了解一系列引导式 Notebook。

[开始学习](https://github.com/NVIDIA/accelerated-computing-hub/tree/main/tutorials/accelerated-python)

### 如何编写 CUDA 程序

了解 CUDA 生态系统以及如何编写 CUDA 程序。

[观看视频](https://www.nvidia.cn/on-demand/session/gtc25-s72897/)

## CUDA 的应用示例：

### 人工智能

### 大语言模型（LLM）训练  

使用 NVIDIA NeMo™ Framework 和 NeMo Curator 训练一个具备推理能力的模块。

- 

博客：[使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM](https://developer.nvidia.cn/blog/train-a-reasoning-capable-llm-in-one-weekend-with-nvidia-nemo/)

- 

代码：[NeMo 框架](https://github.com/NVIDIA/NeMo)

- 

Notebook：[在 48 小时内训练您自己的推理模型](https://github.com/NVIDIA-NeMo/NeMo/blob/main/tutorials/llm/reasoning/Reasoning-SFT.ipynb)

### 人工智能

### 
### 大语言模型（LLM）推理

使用 NVIDIA Dynamo 部署 AI 模型。NVIDIA Dynamo 是一个开源的、低延迟、模块化的推理框架。

- 

博客：[NVIDIA Dynamo，用于扩展推理模型的低延迟分布式推理框架](https://developer.nvidia.cn/blog/introducing-nvidia-dynamo-a-low-latency-distributed-inference-framework-for-scaling-reasoning-ai-models/)

- 

指南：[NVIDIA Dynamo](https://github.com/ai-dynamo/dynamo)

- 

培训：[使用 NVIDIA Dynamo 和 vLLM 部署 LLM 推理](https://github.com/ai-dynamo/dynamo/tree/main/docs/guides)

### 计算机辅助工程

### AI 驱动的 CAE 仿真

使用 CUDA-X 加速的 CAE 工具、AI 仿真、GPU 加速和实时数字孪生加速 CAE 仿真，以设计和构建新技术。

- 

博客：[如何运行 AI 驱动的 CAE 仿真](https://developer.nvidia.cn/blog/how-to-run-ai-powered-cae-simulations/)

- 

指南：[NVIDIA PhysicsNeMo™](https://docs.nvidia.com/physicsnemo/index.html)

- 

培训：[借助 NVIDIA AI 物理技术加速计算机辅助工程 (CAE)](https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-OV-48+V1)

### 数据科学

### 使用 cuDF 加速 DataFrame 和 SQL  

cuDF 是一个 GPU 加速的库，用于优化基础的 DataFrame 与 SQL 操作。它为 pandas、Polars 和 Apache Spark 等常用 DataFrame 工具提供“即插即用”的加速能力，无需修改任何代码即可启用。

- 

Notebook：[构建交互式数据分析控制面板](https://colab.research.google.com/gist/will-hill/aa24c3ffe1428c005af3793fcacf9bd2/cudf_pandas_opencellid_demo.ipynb)

- 

视频：[借助 NVIDIA GPU 上的 pandas 加速探索性数据分析 (16：07)](https://images.nvidia.cn/cn/youtube-replicates/PJpCJsqcfOk.mp4))

- 

用户指南：[cuDF](https://docs.rapids.ai/api/cudf/stable/)

- 

用户指南：[使用 cuDF 加速 Apache Spark](https://nvidia.github.io/spark-rapids/)

### 量子计算

### 借助 NVIDIA CUDA-Q 加速量子计算

NVIDIA CUDA-Q™ 是一款与具体量子处理器（QPU）无关的加速量子超级计算平台。

- 

博客：[NVIDIA CUDA-Q 助力量子应用研究](https://developer.nvidia.cn/blog/nvidia-cuda-q-powers-quantum-applications-research/)

- 

文档：[CUDA-Q](https://nvidia.github.io/cuda-quantum/latest/index.html)

- 

培训：[CUDA-Q 学术](https://github.com/NVIDIA/cuda-q-academic)

### 机器人

### 采用 NVIDIA Cosmos 的世界基础模型

加速智能汽车 (智能汽车) 、机器人和视频分析 AI 智能体的物理 AI 开发。

- 

博客：[使用 NVIDIA Cosmos™ Predict-2 的 AI 基础模型](https://developer.nvidia.com/blog/develop-custom-physical-ai-foundation-models-with-nvidia-cosmos-predict-2/https://developer.nvidia.com/blog/develop-custom-physical-ai-foundation-models-with-nvidia-cosmos-predict-2/)

- 

GitHub：[Cosmos Predict-2](https://github.com/nvidia-cosmos/cosmos-predict2)

- 

GitHub：[Cosmos](https://github.com/nvidia-cosmos)

[查看加速计算学习路径](https://nvdam.widen.net/s/brxsxxtskb/dli-learning-journey-2009000-r5-web)

## CUDA 资源  

博客

会议

培训

### 更简单的 CUDA 简介

Mark Harris 热门博文“更简单的 CUDA 简介”的互动伴奏。

[详细了解 CUDA](https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+T-AC-01+V1)

### 现代 CUDA C++ 中的加速计算入门  

了解如何编写、编译和运行 GPU 加速代码。

[详细了解如何使用 CUDA 加速 C++ 代码](https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-AC-04+V2)

### 加速计算中心

详细了解如何在加速计算中心使用 CUDA，其中包括 C++ 和 Python 分步教程和用户指南。

[详细了解加速计算中心](https://github.com/NVIDIA/accelerated-computing-hub)

[查看加速计算学习路径](https://nvdam.widen.net/s/brxsxxtskb/dli-learning-journey-2009000-r5-web)

## 立即开始使用 CUDA。

[下载 CUDA 工具包](/cuda-downloads &quot;Download CUDA Toolkit&quot;)


