Default Branch

ebd048fc5e · opencl: flash attention improvement (#25069) · Updated 2026-06-27 17:36:06 -05:00

Branches

784d14ed31 · llama : store non-RoPEd K cache (WIP) · Updated 2023-09-17 15:43:07 -05:00    jdelony

8585
5

92a4f86879 · llama : make starcoder graph build more consistent with others · Updated 2023-09-15 09:57:10 -05:00    jdelony

8595
20

e7e7b11455 · llama : remove experimental stuff · Updated 2023-09-14 14:52:01 -05:00    jdelony

8607
3

2f689dee06 · metal : minor · Updated 2023-09-07 07:33:21 -05:00    jdelony

8640
5

30ac7a4117 · gitignore : metal · Updated 2023-09-04 14:23:16 -05:00    jdelony

8652
12

f3a84b2e0d · llama : better express the KV cache dependencies in the graph · Updated 2023-09-04 13:44:48 -05:00    jdelony

8652
5

c79d130f74 · make : fix speculative build · Updated 2023-09-04 07:50:04 -05:00    jdelony

8653
9

847896aba7 · speculative : add --draft CLI arg · Updated 2023-09-03 05:51:07 -05:00    jdelony

8659
3

8c2b881281 · cuda : poc for norm quants (only -b 1 works) · Updated 2023-08-30 13:42:28 -05:00    jdelony

8700
3

b4e70822f6 · metal : add poc for normalized Q4_0 and Q4_1 · Updated 2023-08-30 10:47:16 -05:00    jdelony

8700
7

488e03200e · Merge branch 'master' into gguf-publish-ci · Updated 2023-08-30 03:34:55 -05:00    jdelony

8705
4

33a5517d87 · llama.cpp : print gguf version · Updated 2023-08-26 16:56:48 -05:00    jdelony

8747
10

d34472c124 · Fix HellaSwag · Updated 2023-08-26 02:55:39 -05:00    jdelony

8760
1

0248ca811e · gguf : add notes for tests · Updated 2023-08-25 01:08:05 -05:00    jdelony

8772
10

977629a34e · Merge branch 'master' into fix-eos · Updated 2023-08-23 14:40:19 -05:00    jdelony

8788
4

66a66a05a8 · readme : add notice about new file format · Updated 2023-08-21 14:42:14 -05:00    jdelony

8817
253

6a9e6375b5 · gguf.py : indentation · Updated 2023-08-17 13:53:15 -05:00    jdelony

8832
205

28046d1e52 · Merge and update · Updated 2023-08-08 16:36:11 -05:00    jdelony

8885
12

511055722e · undo formatting · Updated 2023-07-28 01:09:14 -05:00    jdelony

8914
26

af1c9966c8 · gguf : start write tensor info · Updated 2023-07-27 02:32:31 -05:00    jdelony

8914
15