Default Branch

ebd048fc5e · opencl: flash attention improvement (#25069) · Updated 2026-06-27 17:36:06 -05:00

Branches

722f9defe9 · vulkan: intel mmv fix attempt · Updated 2025-11-23 03:13:19 -06:00    jdelony

2696
1

6cdda87baf · ci : disable op offload in some tests · Updated 2025-11-20 09:16:50 -06:00    jdelony

2741
3

dba1cbceb3 · tune for RDNA3 · Updated 2025-11-16 13:21:22 -06:00    jdelony

2749
4

e6dbc81569 · metal : cap threadgroups size of set_rows · Updated 2025-11-10 08:17:09 -06:00    jdelony

2818
1

3ad533689c · ggml : remove KQ mask padding · Updated 2025-11-10 06:35:25 -06:00    jdelony

2820
1

2ef41855cf · convert : for FP8, use scale type to decide auto type · Updated 2025-11-06 21:55:53 -06:00    jdelony

2858
16

e996f3aef8 · convert : fix no-lazy dtypes from direct safetensors · Updated 2025-11-06 21:33:09 -06:00    jdelony

2858
3

128118fdbe · convert : use F32 for dequant of pack-quantized tensors · Updated 2025-11-06 20:59:32 -06:00    jdelony

2858
6

23b70f4f70 · Initial plan · Updated 2025-11-04 05:00:12 -06:00    jdelony

2886
1

d441c31b19 · metal : remove stray return · Updated 2025-11-02 10:24:00 -06:00    jdelony

2910
9

d7f794eadb · convert : avoid dequantizing mxfp4 for GPT-OSS · Updated 2025-10-24 06:56:26 -05:00    jdelony

2997
1

93fbd407f3 · Merge branch 'master' into compilade/convert-prequant · Updated 2025-10-23 13:23:12 -05:00    jdelony

3000
6

f0076dc5a0 · metal : adjust .get_alloc_size to be alloc friendly · Updated 2025-10-19 09:20:54 -05:00    jdelony

3030
1

96f9f391c7 · ggml : fix unaligned access in AMX code · Updated 2025-09-29 02:37:15 -05:00    jdelony

3210
1

a8b0089a5b · ggml : remove SVE paths · Updated 2025-09-28 12:26:03 -05:00    jdelony

3210
1

837b1b4563 · ggml : remove KQ mask padding · Updated 2025-09-28 10:10:17 -05:00    jdelony

3213
6

17ca6ed540 · Implement llama-pull tool · Updated 2025-09-20 11:25:21 -05:00    jdelony

3301
1

e83ef74733 · one less magic number · Updated 2025-09-20 00:58:36 -05:00    jdelony

3320
6

652d303b32 · metal : fuse add + rms · Updated 2025-09-18 08:29:25 -05:00    jdelony

3318
1

64c6dcbe6d · metal : make the NSG a function constant in mul_mv kernels · Updated 2025-09-18 03:31:59 -05:00    jdelony

3323
2