跳转至

鳄霸编程参考

欢迎来到鳄霸编程参考。本节提供 鳄霸(Croqtile) 的详尽语法与语义文档——一种面向高性能内核编程的 C++ 嵌入式 DSL,具备易用的语法与零开销抽象、全面的编译期安全性、一等的动态形状支持以及面向 AI 调优的设计。

本参考涵盖的内容

本参考覆盖鳄霸编程的方方面面:

  1. 程序结构:鳄霸程序如何组织——__co__ 函数、宿主端 API 以及与 C++ 的互操作。

  2. 带形状数据:鳄霸的多维张量类型系统——形状、MDSpan、spanned data、符号维度与动态形状。

  3. 循环与并行:SPMD 并行、循环控制、分块与迭代构造。

  4. 数据搬运:DMA 语句、使用 chunkat 分块、TMA、swizzle 以及高级数据搬运模式。

  5. C++ 嵌入:输入/输出约定、__cpp__ 内联块、宏与预处理器集成。

  6. MPMD 编程:线程掩码、事件、异步执行与 warp 特化。

  7. 优化模式:Tileflow 优化、异步 DMA 模式、多级缓冲与性能调优技巧。