跳转至

鳄霸(Croqtile)

鳄霸(Croqtile) 的文档与教程。鳄霸是面向高性能内核编程的 C++ 嵌入式 DSL,具备易用的语法与零开销抽象、全面的编译期安全检查、一等的动态形状与符号维度支持,以及从设计之初即面向 AI 调优的架构。

文档结构

第一部分 — 教程

面向新手的逐步教学。从最简单的内核出发,通过不断演进的矩阵乘法变体,逐步介绍鳄霸的语法。无需任何鳄霸经验——只要求基本的 C++ 和 GPU 编程概念。

第二部分 — 性能调优实战

以案例驱动的性能工程。每个章节对一个真实内核族进行剖析,定位瓶颈,并应用优化模式以逼近硬件峰值。涵盖性能分析、基准测试、编译器标志与 AI 调优工作流。

第三部分 — 编程参考

详尽的语法与语义参考。每一个鳄霸语言构造——形状、DMA、循环、并行、事件、内存、宏等——均有详细文档。

第四部分 — 设计原理

深入探讨鳄霸的设计理念、权衡取舍与前沿挑战。(筹划中)