Roofline analysis for GEMM/Attention. Use when: classify an operator as compute bound vs L1 bound vs LLC bound vs memory bound; estimate FLOPs/bytes from shapes; interpret VTune/oneAPI profiler bytes/time for Intel GPU (SYCL/XPU).
このスキルにはエージェント指示付きの SKILL.md が含まれています。