Search Results: gpu-acceleration

Found 20 Skills

polars

Polars fast DataFrame library. Use for fast data processing.

perf-optimization

Performance optimization coordination playbook. Contains specialist routing table, TileIR two-step pipeline, kernel generation specialist selection, prioritization criteria, and safe modification workflow. Use when the user asks to apply optimizations, write kernels, or improve performance. Covers both user-specified optimization and autopilot-driven iterative optimization.

🇺🇸|EnglishTranslated

AI & Machine Learningtondevrel/scientific-agen...

jax

Composable transformations of Python+NumPy programs. Differentiate, vectorize, JIT-compile to GPU/TPU. Built for high-performance machine learning research and complex scientific simulations. Use for automatic differentiation, GPU/TPU acceleration, higher-order derivatives, physics-informed machine learning, differentiable simulations, and automatic vectorization.

🇺🇸|EnglishTranslated

Data Processingalphaonedev/openclaw-grap...

coding-julia

Julia: multiple dispatch, type system, metaprogramming, Pkg, scientific computing, GPU CUDA.jl

🇺🇸|EnglishTranslated

Data Processingstarlitnightly/omicverse

single-cell-preprocessing-with-omicverse

Walk through omicverse's single-cell preprocessing tutorials to QC PBMC3k data, normalise counts, detect HVGs, and run PCA/embedding pipelines on CPU, CPU–GPU mixed, or GPU stacks.

🇺🇸|EnglishTranslated

AI & Machine Learningnvidia/skills

kernel-triton-writing

ONLY for OpenAI Triton (@triton.jit) kernel development. NEVER use for CUDA C++ kernels, TileIR, or profiling tools (ncu, nsys). The user's request must involve Triton explicitly. Covers Triton-specific patterns: fused elementwise, reductions (softmax, LayerNorm, RMSNorm), tiled GEMM with triton.autotune, and flash attention. Workflow: design, write, verify (with fast-path for explicit requests).

🇺🇸|EnglishTranslated

3 scripts/Attention

AI & Machine Learningmodular/skills

mojo-gpu-fundamentals

The basics of how to program GPUs using Mojo. Use this skill in addition to mojo-syntax when writing Mojo code that targets GPUs or other accelerators. Use targeting code to NVIDIA, AMD, Apple silicon GPUs, or others. Use this skill to overcome misconceptions about how Mojo GPU code is written.

🇺🇸|EnglishTranslated

AI & Machine Learningnvidia/skills

perf-parallelism-strategies

Operational guide for choosing and combining parallelism strategies in Megatron Bridge, including sizing rules, hardware topology mapping, and combined parallelism configuration.

🇺🇸|EnglishTranslated