mirror of
https://github.com/ikawrakow/ik_llama.cpp.git
synced 2026-06-28 04:30:15 -05:00
Compare commits
base: jdelony:main
jdelony:main
jdelony:ik/revert_dflash_swa_opt
jdelony:ik/dflash_tweaks
jdelony:ik/qwen35_mtp_smgraph
jdelony:ik/g4_assistant_smgraph
jdelony:ik/tensor_names
jdelony:fcp/checkpoint_min_var
jdelony:ik/purge_blas
jdelony:ik/gemma4_mtp_last_device
jdelony:ik/gemma4_mtp_graph_reuse
jdelony:ik/compat_g4_assistant
jdelony:ik/fix_gemma4_mtp
jdelony:ik/glm_mtp_warmup
jdelony:ik/fix_qwen_mtp_warmup
jdelony:ik/dflash_fix_smgraph
jdelony:ik/dflash_fix_cpu
jdelony:ik/fattn_mma_gqa_16
jdelony:ik/minimaxm3_smgraph
jdelony:ik/fix_1961
jdelony:ik/handle_think_no_space
jdelony:ik/mmq_show_error_details
jdelony:ik/cohere2_moe_graph_opt
jdelony:ik/gemma4_e2b_tweaks
jdelony:ik/fa_512_512_turing
jdelony:ik/bug_fixes_1926
jdelony:ik/laguna_sm_graph
jdelony:ik/fix_grt_bf16
jdelony:ik/alternative_gemma4_assistant
jdelony:ik/cpu_fa_disable_mask_opt
jdelony:ik/fa_gemma4_assistant
jdelony:ik/check_for_empty_mask
jdelony:ik/gemma4_12B_smgraph
jdelony:ik/mellum_sm_graph
jdelony:ik/mla_add_extra_nodes
jdelony:ik/quantize_gemma4
jdelony:ik/limit_amb
jdelony:ik/gemma4_mtmd_blindness
jdelony:ik/qwen_mtp_inp_out_ids
jdelony:ik/glm5_mtp
jdelony:ik/hadamard_block_size
jdelony:ik/fix_glm_mtp_smgraph
jdelony:ik/fix_glm_mtp_accept
jdelony:ik/fix_mla_smgraph_cache_load_save
jdelony:ik/disable_khadamard_if_not_power2
jdelony:ik/logging_cleanup
jdelony:ik/per_gpu_fit_margin
jdelony:ik/fix_partial_ngl_smgraph_mla
jdelony:ik/fix_partial_ngl_smgraph
jdelony:ik/mtp_accept_only_last_logits
jdelony:ik/fix_q35moe_mtp_smgraph
jdelony:ik/disable_smgraph_qwen35moe_mtp
jdelony:ik/fix_partial_offload_crash
jdelony:ik/fix_gemma_e4b
jdelony:ik/fix_mtp_no_gr
jdelony:ik/fix_mla1
jdelony:ik/rm_Makefile
jdelony:ik/fix_dst_backend
jdelony:ik/enable_smgraph_mla_hybrid
jdelony:ik/mla_smgraph
jdelony:ik/gemma4_mtp_extra_output
jdelony:ik/fix_qwen35moe_low_mtp_acceptance
jdelony:ik/fix_mtp_plus_muge
jdelony:ik/add_extra_output_tensor
jdelony:ik/mtp_requantize_output
jdelony:ik/imatrix_ffn_gate
jdelony:ik/faster_imatrix
jdelony:ik/fix_ggml_nbytes
jdelony:ik/mtp_tweaks_2
jdelony:ik/per_step_conv_states
jdelony:ik/gemma4_mtp_avoid_f32_cast
jdelony:ik/fix_glm_mtp
jdelony:fix-recurrent-ckpt-prealloc
jdelony:ik/mtp_reuse_graphs_2
jdelony:ik/avoid_per_step_ssm_copy
jdelony:ik/avoid_recurrent_state_copy
jdelony:ik/mtp_per_step_smgraph
jdelony:ik/fix_mistral3_smgraph
jdelony:ik/faster_per_step_restore
jdelony:ik/fast_sampling_avx2
jdelony:ik/mtp_async_copies
jdelony:ik/fix_mtp_discarding
jdelony:ik/mtp_tweaks1
jdelony:ik/better_mtp
jdelony:ik/minor_mtp1
jdelony:ik/set_draft_input_hidden_state
jdelony:ik/mimo2.5
jdelony:ik/disable_k_shift_smgraph
jdelony:ik/mtp_reuse_graphs
jdelony:ik/better_moe_small_batch
jdelony:revert-1696-fix/recurrent-state-reset
jdelony:ik/enable_cuda_graphs_with_reduce
jdelony:ik/disabled_cuda_graphs
jdelony:ik/revert_1687
jdelony:ik/better_fixup_stream_k
jdelony:ik/quantize_options
jdelony:ik/faster_iq2ks_quantize
jdelony:ik/mistral4_cpu_fa
jdelony:ik/fix_cuda_nans
jdelony:ik/fix_gemma4_hybrid
jdelony:ik/refactor_graphs
jdelony:ik/disallow_speculation_for_hybrid
jdelony:ik/try_minimax_better_sm_graph
jdelony:ik/cpu_mla_all_quants
jdelony:ik/gemma4_vision
jdelony:ik/fuse_rms_rms_add
jdelony:ik/fix_minimax_hadamard
jdelony:ik/graph_reuse_field
jdelony:ik/gemma4_routing
jdelony:ik/gemma4_fuse_logits
jdelony:ik/gemma4_gp_bugfix
jdelony:ik/gemma4_tokenizer_fixes
jdelony:ik/sm_graph_gemma4_moe
jdelony:ik/standardize_gemma4
jdelony:ik/mixd_kv_cache
jdelony:ik/hadamard_512
jdelony:ik/fix_gemma4_quantized_KV_cache_cuda
jdelony:ik/fix_gemma4_quantized_kv_cache_cpu
jdelony:ik/gemma4
jdelony:ik/pinned_suggest
jdelony:ik/bonsai_neon
jdelony:ik/bonsai_avx2
jdelony:ik/mtmd_kq_type
jdelony:ik/fix_unknown_tensor_type
jdelony:ik/fix_mmproj_bf16_cpu
jdelony:ik/check_cpu_fa_supported_types
jdelony:ik/fix_requantize_interleaved_2
jdelony:ik/worst_graph_tokens
jdelony:ik/better_q40_kv_cache_cpu
jdelony:ik/enable_all_iqk_fa_quants
jdelony:ik/better_q40_kv_cache
jdelony:ik/keep_mmap_with_no_pinned
jdelony:ik/llama_bench_fit
jdelony:ik/honor_manual_splits
jdelony:ik/llama_bench_sm_arg
jdelony:ik/v_cache_hadamard
jdelony:ik/fix_hadamard_bug
jdelony:ik/fix_cpu_fa_bf16
jdelony:ik/log_probs_on_crash
jdelony:ik/fix_jinja
jdelony:ik/warn_pinned_alloc
jdelony:ik/ignore_nextn
jdelony:ik/fix_bug_added_in_1506
jdelony:ikawrakow-patch-2
jdelony:ik/cuda_use_pinned_memory_2
jdelony:ik/cuda_use_pinned_memory
jdelony:ik/sm_graph_partial_offload
jdelony:ik/fit_dense_model
jdelony:ik/model_fit
jdelony:ik/revert_1496
jdelony:ik/gpu_layers_3
jdelony:ik/gpu_layers_2
jdelony:ik/cpu_swa_fa
jdelony:ik/fix_misleading_quantize_error
jdelony:ik/fancy_simd_log
jdelony:ik/fix_1478
jdelony:ik/gpu_layers
jdelony:ik/better_n_cpu_moe
jdelony:ik/fattn_fix_overflow
jdelony:ik/barrier
jdelony:ik/mistral4
jdelony:ik/q35_tweaks
jdelony:ik/rtr_plus_muge
jdelony:ik/ssm_conv4_silu
jdelony:ik/undo_1421
jdelony:ik/fix_1438
jdelony:ik/fix_1432
jdelony:ik/fix_llama_kv_cache_cell_max
jdelony:ik/delta_net_tweaks
jdelony:ik/faster_cpu_fused_rms1
jdelony:ik/faster_cpu_fused_rms
jdelony:ik/fix_hybrid_graph_muge
jdelony:ik/fuse_ssm_silu_neon
jdelony:ik/ot_ffn_gate_up
jdelony:ik/fdn_fuse_silu_cpu
jdelony:ik/quantize_fused_up_gate
jdelony:ik/imatrix_fused_up_gate
jdelony:ik/sampling_top_n_sigma
jdelony:ik/sm_graph_muge
jdelony:ik/sm_graph_pre_merged_up_gate
jdelony:ik/pre_merged_up_gate
jdelony:ik/ssm_conv4_avx2
jdelony:s6/imatrix_conv
jdelony:ik/qwen35moe_muge
jdelony:ik/cuda_ctx_mess
jdelony:ik/reset_1st_recurrent_graph
jdelony:ik/sm_graph_delta_net
jdelony:ik/fix_sm_graph_with_vision
jdelony:ik/qwen35_model_types
jdelony:ik/minor_silu
jdelony:ik/delta_dry
jdelony:ik/fix_qwen35_smgraph_hybrid
jdelony:ik/quantize_mmproj
jdelony:ik/disable_smgraph_recurrent
jdelony:ik/fused_delta_net_avx512
jdelony:ik/delta_net_neon
jdelony:ik/clang_warnings
jdelony:ik/simplify_delta_net_2
jdelony:ik/mtmd_reduce_memory_use
jdelony:ik/sm_graph_qwen35moe
jdelony:ik/qwen3.5_vision
jdelony:ik/qkvz_tweak1
jdelony:ik/fused_delta_net_3a
jdelony:ik/revert_delta_net_3
jdelony:ik/qkvz_tweak
jdelony:ik/simplify_delta_net
jdelony:ik/fused_delta_net_3
jdelony:ik/sm_graph_q35
jdelony:ik/slightly_better_fdn
jdelony:ik/qwen35_std_attn
jdelony:ik/fattn_q35dense
jdelony:ik/qwen35dense
jdelony:ik/faster_moe_quantize
jdelony:ik/fix_quantize_kt
jdelony:ik/fused_delta_net_2
jdelony:ik/fused_delta_net
jdelony:ik/quantize_dry_run
jdelony:ik/minor_delta_tweak
jdelony:ik/graph_parallel_tweak
jdelony:ik/max_nodes_again
jdelony:ik/fix_hybrid_detection
jdelony:ik/max_nodes
jdelony:ik/sm_graph_q3next
jdelony:ik/qwen35moe
jdelony:ik/delta_net
jdelony:ik/fix_imatrix_check
jdelony:ik/q3next_opt3
jdelony:ik/q3next_cuda_graphs
jdelony:ik/q3next_opt2
jdelony:ik/q3next_concat_cpu
jdelony:ik/q3next_concat
jdelony:ik/qwen3next
jdelony:ik/glm5
jdelony:ik/try_fix_1222
jdelony:ik/gguf_bool_arrays
jdelony:ik/step35_compat
jdelony:ik/fused_mul_unary_1
jdelony:ik/fix_graph_parallel_partial_offload
jdelony:ik/cpu_repeat
jdelony:ik/fix_1237
jdelony:ik/sm_graph_step35
jdelony:ik/change_default_fa_offset
jdelony:ik/step35
jdelony:ik/sm_graph_seedoss
jdelony:ik/fattn_gqa_10
jdelony:s6/seed_support2
jdelony:ik/cpu_moe_tg
jdelony:ik/fix_cpu_fa_work_buffer_size
jdelony:ik/cpu_fa_dont_repack_tg
jdelony:ik/better_cpu_fa_thread_strategy
jdelony:ik/reduce_mla3_compute_buffer_size
jdelony:ik/try_fix_1201
jdelony:ik/fix_1205
jdelony:ik/huihui_57B
jdelony:ik/minimax_graph_minor
jdelony:ik/fa_offset_2
jdelony:ik/fattn_kq_max_offset
jdelony:ik/minmax2_sm_graph
jdelony:ik/minimax2_very_fast
jdelony:ik/glm45_tg_very_fast
jdelony:ik/sync_fa
jdelony:ik/try_split_mla
jdelony:ik/glm47_fa_2
jdelony:ik/shexps_better_hybrid
jdelony:ik/better_fa_glm45
jdelony:ik/rng_sampling
jdelony:ik/glm45_tg_fa_hack
jdelony:ik/glm47_tg_fa_hack
jdelony:ik/remove_llamafile
jdelony:ik/sm_graph_cuda_graphs
jdelony:ik/fix_batched_cublas
jdelony:ik/sweep_bench_nrep
jdelony:ik/correct_missing_gating_func_comments
jdelony:ik/correct_glm47_flash_gating_func
jdelony:ik/cuda_graphs_with_overrides
jdelony:ik/fix_windows_no_omp
jdelony:ik/topk_moe_fuse_bias
jdelony:ik/glm_flash
jdelony:ik/sampling_refactor_sorting
jdelony:ik/adaptive_p_2
jdelony:ik/adaptive_p
jdelony:ik/fix_add_bf16_turing
jdelony:ik/skip_get_rows
jdelony:ik/reduce_make_copies
jdelony:ik/extra_reduce_types
jdelony:ik/try_fix_many_gpus_2
jdelony:ik/try_fix_many_gpus
jdelony:ik/fix_exp_shexp_split
jdelony:ik/llama_bench_overrides
jdelony:ik/llama_bench_sas
jdelony:ik/merge_up_gate_exps_3
jdelony:ik/merge_up_gate_exps_2
jdelony:ik/fuse_merge_up_gate_exps
jdelony:ik/try_authors
jdelony:ik/bailingmoe2_graph
jdelony:ik/deepseek_mla0
jdelony:ik/update_authors
jdelony:ik/fix_gpt_oss_partial_offload
jdelony:ik/graph_better_splits
jdelony:ik/fix_reduce_race
jdelony:ik/ernie_graph
jdelony:ik/dont_abort_on_nccl_init_failure
jdelony:ik/gpt_oss_graph
jdelony:ik/hunyuan_graph
jdelony:ik/mimo2_4_gpus
jdelony:ik/fix_ring_reduction
jdelony:ik/reduce_race_quick_fix
jdelony:ik/qwen3vl_graph
jdelony:ik/qwen3_graph
jdelony:ik/mimo2_graph
jdelony:ik/fix_fa_192_128
jdelony:ik/mimo2
jdelony:ik/graph_reuse_on
jdelony:ik/nccl3_async
jdelony:ik/more_set_device
jdelony:ik/ring_reduce
jdelony:ik/fix_no_p2p_case
jdelony:ik/reduce_no_nccl
jdelony:ik/split_mode_f32
jdelony:ik/fused_norm
jdelony:ik/nccl3
jdelony:ik/nccl2
jdelony:ik/nccl1
jdelony:ik/p2p_cpy_set_device
jdelony:ik/better_graph_pp
jdelony:ik/better_graph_tg
jdelony:ik/ignore_nextn_layers
jdelony:ik/cohere2_sm_graph
jdelony:ik/fix_sync_logic
jdelony:ik/undo_sync_reduction
jdelony:ik/undo_1049_if_tensor_overrides
jdelony:ik/fix_mmq_overflow
jdelony:ik/sm_graph_rearrange
jdelony:ik/disable_or_enable_p2p
jdelony:ik/fix_1055
jdelony:ik/fix_the_fix
jdelony:ik/sm_graph_max_gpu
jdelony:ik/fix_bench_compile
jdelony:ik/sm_graph_sync
jdelony:ik/try_split_offloaded_moe_up_gate
jdelony:ik/backend_reduce_syncs
jdelony:ik/split_graph_2
jdelony:ik/handle_split_cache
jdelony:ik/fix_annoying_warnings
jdelony:ik/sm_graph_disable_cuda_graphs
jdelony:ik/cuda_set_device
jdelony:ik/dont_split_output
jdelony:ik/fix_debug_build
jdelony:ik/mistral3_large
jdelony:ik/k_cache_hadamard_cuda
jdelony:ik/k_cache_hadamard
jdelony:ik/mistral3_std_attn
jdelony:ik/fix_cuda_scale_bug
jdelony:ik/ministral3
jdelony:ik/graph_alloc
jdelony:ik/allow_empty_splits
jdelony:ik/is_this_better_for_multi_gpu
jdelony:ik/slightly_better_graph_split_strategy
jdelony:ik/poc_tp_glm4.5
jdelony:ik/fix_rpc_off2
jdelony:ik/poc_tp
jdelony:ik/try_fix_1014
jdelony:ik/fix_1015
jdelony:fcp/fix_rpc_device
jdelony:ik/gguf_py_add_maxfp4
jdelony:ik/iq4_nl_cache
jdelony:ik/fix_q6_0_dequantize
jdelony:ik/disable_rope_cache
jdelony:ik/support_gigachat
jdelony:ik/wip_sync_llama
jdelony:ik/fix_requantize_interleaved
jdelony:ik/gguf_py_changes_for_np2.0
jdelony:ik/fix_kimi2_parse
jdelony:ik/disable_sm_row
jdelony:ik/try_fix_974
jdelony:ik/deepseek_guarantee_rope_fusion
jdelony:ik/topk_moe_with_norm
jdelony:ik/fused_rope_rope
jdelony:ik/add_vq_help
jdelony:fcp/context_shift_fix
jdelony:ik/gemma3_mqkv_rcache
jdelony:ik/fix_rtr_mqkv
jdelony:ik/deepseek_rope_cache
jdelony:ik/gemma_output_tensor
jdelony:ik/fix_fattn_supported
jdelony:ik/really_fix_rope_cache
jdelony:ik/add_jinja_file_help
jdelony:ik/graph_reuse
jdelony:ik/fix_up_gate_mmq_not_supported
jdelony:ik/fix_repacked_legacy_quants
jdelony:ik/llama_bench_mla3
jdelony:ik/fix_windows_avx512
jdelony:ik/fix_rope_norm_fast_cuda
jdelony:ik/fa_mainline_compat
jdelony:ik/mla=3_by_default
jdelony:ik/deepseek_merge_qk
jdelony:ik/enable_fusion_by_default
jdelony:ik/iqk_mmvq_opt
jdelony:ik/llama_bench_n_cpu_moe
jdelony:ik/llama_bench_rcache
jdelony:ik/remove_unnecessary_calls
jdelony:ik/smollm3
jdelony:ik/deepseek_fa_opt
jdelony:ik/fuse_bias_only_tg
jdelony:ik/make_biased_gemv_optional
jdelony:ik/deepseek_opt
jdelony:ik/use_mmq_id_for_moe
jdelony:ik/fuse_kvcache_copy
jdelony:ik/another_mmq_id_fix
jdelony:ik/disable_add_fused_rms
jdelony:ik/fix_mmq_id
jdelony:ik/fix_iqk_for_strange_numrows
jdelony:ik/cuda_params
jdelony:ik/disable_fusion_by_default
jdelony:ik/option_to_disable_cuda_fusion
jdelony:ik/fix_after_883
jdelony:ik/cpu_fa_tg_glm4.5
jdelony:ik/sweep_bench_n_predict
jdelony:ik/quantize_ffn_gate_inp
jdelony:ik/merge_only_qk
jdelony:ik/disable_some_fusion
jdelony:ik/rope_cache
jdelony:ik/cuda_lto
jdelony:ik/cuda_rope_back
jdelony:ik/fused_rms_rms
jdelony:ik/biased_mmvq
jdelony:ik/merge_qkv
jdelony:ik/fattn_is_supported
jdelony:ik/try_remove_cpy_indirection
jdelony:ik/fuse_biased_qkv
jdelony:ik/biased_qkv
jdelony:ik/reorg_mmvq_and_fuse_bias
jdelony:ik/change_fmoe_fa_defaults
jdelony:ik/mmvq_args
jdelony:ik/mmvq_fuse_bias
jdelony:ik/format_name
jdelony:ik/fused_mul_multiadd
jdelony:ik/fix_experts_node_name
jdelony:ik/fuse_add_add_fused_rms
jdelony:ik/try_fix_854
jdelony:ik/fuse_add_fused_rms
jdelony:ik/fix_fused_grouped_topk
jdelony:ik/rms_block_size
jdelony:ik/debug_849
jdelony:ik/fix_pr_842
jdelony:ik/no_KV_for_unused_layers
jdelony:ik/ooae_on_by_default
jdelony:ik/fused_bailingmoev2
jdelony:ik/n_cpu_moe
jdelony:ik/cuda_grouped_topk
jdelony:ik/try_grouped_topk_playing1
jdelony:ik/cpu_argsort
jdelony:ik/bailingmoe2
jdelony:ik/dup_experts_bias
jdelony:ik/fix_827
jdelony:ik/mask_mt
jdelony:ik/fix_perf_regression
jdelony:ik/llama_warnings
jdelony:ik/refactor_llama.cpp
jdelony:ik/debug_issue_733
jdelony:ik/try_fix_avx2_fa
jdelony:ik/fix_gemma3_vision
jdelony:ik/vendor
jdelony:ik/dedup_stb_image
jdelony:ik/add_mtmd
jdelony:ik/better_fa_masking
jdelony:ik/fix_dequantize_when_requantizing
jdelony:ik/fuse_qkv
jdelony:ik/cpu_topk_moe
jdelony:ik/try_fix_772
jdelony:ik/cuda_topk_moe
jdelony:ik/fix_compiler_warnings
jdelony:ik/ooae2
jdelony:ik/fix_contiguously_allocated
jdelony:ik/cpu_swa_v2
jdelony:ik/cuda_swa3
jdelony:ik/sched_copy_experts
jdelony:ik/cuda_swa2
jdelony:ik/sched_max_copies=1
jdelony:ik/revert_739
jdelony:ik/cuda_refactor_fattn
jdelony:s6/fix_prompt_tokenization
jdelony:ik/fused_ffn_up_gate
jdelony:ik/fix_missing_end
jdelony:ik/skip_rowids_computation
jdelony:ik/optional_yarn_log_multiplier
jdelony:ik/sanitize_importance_iqk
jdelony:ik/validate_quants_on_load
jdelony:ik/mmq_id_thresh
jdelony:ik/fix_avx2_gemm_mess
jdelony:ik/add_mmq_id
jdelony:s6/mikupad
jdelony:ik/debug_issue_721
jdelony:ik/sanitize_importance_kt_quants
jdelony:ik/fix_q80_avx2_2
jdelony:ik/remove_scary_warning
jdelony:ik/cuda_iq2k_use_bperm1
jdelony:ik/cuda_iq3k_use_bperm1
jdelony:ik/cuda_use_bperm
jdelony:ik/q8_k_r16
jdelony:ik/try_fix_690
jdelony:ik/disable_vocab_debug
jdelony:ik/fix_q80_avx2_mess
jdelony:ik/fix_q80_moe_avx2
jdelony:ik/disable_experimental_code1
jdelony:ik/cpu_swa_v1
jdelony:ik/reverts
jdelony:ik/fix_glm4_attn
jdelony:ik/cpu_swa_v0
jdelony:ik/try_cuda_graphs
jdelony:ik/gpt-oss
jdelony:s6/fix_kshift_crash
jdelony:ik/mxfp4
jdelony:ik/fix_quantized_kv_nofa
jdelony:ik/vulkan1
jdelony:ik/iq4_kss_improvements
jdelony:ik/fix_comma_pauses
jdelony:ik/iq1_m_neon
jdelony:ik/iq1m_gemm
jdelony:ik/iq1_kt
jdelony:ik/quantization_tweaks
jdelony:ik/q8_k_r8_avx512
jdelony:ik/vulkan_again
jdelony:ik/iq2_kl
jdelony:ik/add_iq3ks_to_gguf
jdelony:ik/fix_596
jdelony:s6/dots
jdelony:s6/readme-minor2
jdelony:ik/apply_cuda_faster_iq3k
jdelony:ik/cuda_faster_iq2k
jdelony:ik/cuda_quantized_fmoe
jdelony:ik/vulkan_fattn
jdelony:ik/add_forgotten_multi_add
jdelony:ik/vulkan_multi_add
jdelony:ik/vulkan_disable_multi_add
jdelony:ik/vulkan_fused_mul_unary
jdelony:ik/fix_rpc_off
jdelony:ik/fix_missing_dry
jdelony:ik/vulkan_fused_rms
jdelony:ik/kq_mask_padding_64
jdelony:ik/fix_vulkan_required
jdelony:ik/iq3_ks_v2
jdelony:ik/vulkan_disable_fused_ops
jdelony:ik/improve_mmq
jdelony:ik/cuda_large_cpy
jdelony:ik/mmq_to_cublas
jdelony:ik/cuda_iqk_r4
jdelony:ik/falcon_edge
jdelony:ik/gemm_neon_1bit
jdelony:ik/gemm_neon_kquants
jdelony:ik/gemm_neon_iquants
jdelony:ik/gemm_neon_iqk
jdelony:ik/gemm_neon_legacy
jdelony:ik/metal_new_trellis
jdelony:ik/trellis_opt
jdelony:ik/neon_iq3_kt
jdelony:ik/fix_neon_build
jdelony:ik/fix_538
jdelony:s6/readme-minor1
jdelony:ik/new_iq2kt_v2
jdelony:ik/legacy_gemm
jdelony:ik/iqk_gemm
jdelony:ik/q6_k_gemm
jdelony:ik/fix_bug_481
jdelony:s6/readme_update
jdelony:ik/q4_k_gemm
jdelony:ik/iq_gemv_tweaks
jdelony:ik/moe_offload_strategy
jdelony:ik/iq3_s_gemm
jdelony:ik/iq1_s_gemm
jdelony:ik/iq3_xxs_gemm
jdelony:ik/iq2_xxs_gemm
jdelony:ik/new_iq2kt
jdelony:s6/docs_update
jdelony:ik/new_iq4kt
jdelony:s6/list_prompt_cache
jdelony:ik/fix_499
jdelony:ik/new_trellis_2
jdelony:ik/check_up_gate_fmoe
jdelony:s6/MLA_prompt_save_restore_fix
jdelony:ik/llama_hparams_add_mla
jdelony:ik/cuda_iq1_m_r4
jdelony:ik/mmq_iq_ks_r4
jdelony:ik/cuda_iq1_s_r4
jdelony:ik/sampling-top-n-sigma
jdelony:ik/dequant_moe_gemm
jdelony:ik/mmvq_type_supported
jdelony:ik/sampling-xtc
jdelony:ik/trellis_bf16
jdelony:ik/trellis_metal
jdelony:ik/repack_f16
jdelony:ik/dequant_gemm
jdelony:ik/remove_kv_l
jdelony:s6/remove_kv_l
jdelony:ik/trellis_neon
jdelony:ik/server_send_done
jdelony:ik/minor_iq2ks_tweak
jdelony:s6/cache_default
jdelony:ik/cuda_iqk_ks_r4
jdelony:ik/cuda_iq4_k_r4
jdelony:ik/add_missing_gguf_constants
jdelony:ik/remove_iqk_option
jdelony:s6/fp8_native
jdelony:ik/opt_kt_quants
jdelony:ik/fix_447
jdelony:ik/fix_mmvq_bug
jdelony:ik/fix_typo
jdelony:ik/cuda_tracer
jdelony:ik/andrew_trellis
jdelony:ik/desperate_bug_fix_attempt
jdelony:ik/cuda_mailine_fixes
jdelony:ik/refactor_iqk
jdelony:ik/disable_multi_add
jdelony:ik/option_cpu_fa
jdelony:ik/zen4_faster_iq4ks_iq5ks
jdelony:ik/iq5_ks_r4
jdelony:ik/fix_iq4k_avx2
jdelony:ik/add_missing_mmq_iq5ks
jdelony:ik/iq5_ks
jdelony:ik/fix_standard_attention_cpu
jdelony:ik/cuda_mmq_iq2_k
jdelony:ik/cuda_mmq_iq4_k
jdelony:ik/fix_ser_cuda
jdelony:ik/fix_ser
jdelony:ik/fix_412
jdelony:ik/fix_mla_imatrix
jdelony:ik/cpu_deepseek_fa
jdelony:ik/enable_mla3_in_crippled_ggufs
jdelony:ik/cuda_flash_mla3_v2
jdelony:ik/fix_cuda_fa_race
jdelony:ik/offload_policy
jdelony:ik/remove_unnessessary_ids_copy
jdelony:s6/rope_freq_fix
jdelony:ik/cuda_fix_quantized_flash_mla3
jdelony:ik/handle_incompatible_deepseek_ggufs
jdelony:ik/fix_deepseek_q80_cache
jdelony:ik/fix_xeon_6226R
jdelony:ik/cuda_flash_mla3
jdelony:s6/deci_support
jdelony:ik/fix_deepseek_fattn
jdelony:ik/sweep_bench_warmup
jdelony:ik/cuda_mmq_iq4_ks
jdelony:ik/try_fix_367_v2
jdelony:ik/fattn_mma
jdelony:ik/try_fix_367
jdelony:s6/bitnet_name_update
jdelony:ik/fix_fa_avx2_bug
jdelony:s6/qwen3_dynamic_yarn
jdelony:ikawrakow-patch-1-1
jdelony:ik/fix_358
jdelony:ik/add_missing_enum_values_qwen3
jdelony:ikawrakow-patch-1
jdelony:ik/fattn_work_buffer
jdelony:ik/fix_div_zero
jdelony:ik/fix_q41_q51_arm
jdelony:ik/cohere2
jdelony:ik/arch_flags
jdelony:ik/fix_arm_fa
jdelony:ik/pickup_13095
jdelony:ik/fix_llama4_attention
jdelony:s6/fix_python
jdelony:ik/bitnet_adjustments
jdelony:s6/bitnet2b_2501
jdelony:s6/termux_fix
jdelony:ik/tg_tweaks
jdelony:ik/faster_avx2_q40
jdelony:ik/gemma_q80_kvcache
jdelony:ik/imatrix_lsim
jdelony:ik/hide_imatrix
jdelony:ik/improve_iq1m
jdelony:ik/fix_kld
jdelony:ik/l4_rms_norm
jdelony:ik/llama4
jdelony:ik/improve_iq2ks
jdelony:ik/mla_guard
jdelony:ik/update_license
jdelony:ik/copyright
jdelony:ik/try_fa_no_q80_repack
jdelony:ik/fix_cuda_memcpy_async
jdelony:ik/improve_iq2_xs
jdelony:ik/flax-vector-conversions
jdelony:ik/metal_fattn_update
jdelony:ik/fix_gcc_arm
jdelony:ik/metal_moe
jdelony:ik/fix_neon_q82
jdelony:ik/iqk_q_improvements
jdelony:ik/fix_300
jdelony:ik/interleaved_guards
jdelony:ik/make_qx_quants
jdelony:ik/change_q_pure
jdelony:ik/use_q8_2
jdelony:ik/test_q80_NaNs
jdelony:s6/numa_KV
jdelony:s6/sweep_bench_update
jdelony:ik/deepseek_is_this_better
jdelony:ik/llama_bench_tgb
jdelony:ik/cuda_better_moe
jdelony:ik/better_batched_processing
jdelony:ik/test_thp
jdelony:ik/cuda_native
jdelony:ik/fix_again_cmake
jdelony:ik/better_flash_mla
jdelony:ik/gemma3
jdelony:ik/bug_missing_parentheses
jdelony:ik/offline_repack_patterns
jdelony:ik/FlashMLA-3
jdelony:ik/offline_repack
jdelony:ik/tensor_override_honor_mmap
jdelony:ik/fix_dup_q
jdelony:ik/avoid_cuda_mla_1
jdelony:ik/mla2_q80_cache_cpu
jdelony:ik/mla2_q80_cache
jdelony:ik/fix_pr_261
jdelony:ik/use_bf16_when_no_mmq
jdelony:ik/flash_mla2_cuda_no_f32
jdelony:ik/prepare_wk_b
jdelony:ik/flash_mla2_no_f32
jdelony:ik/cuda_flash_mla_q8_0
jdelony:ik/flash_precision
jdelony:ik/mla_imatrix
jdelony:ik/cuda_faster_moe_tg
jdelony:ik/flash_mla_4
jdelony:ik/flash_mla_2
jdelony:ik/custom_q_rules
jdelony:ik/better_tg_fattn
jdelony:ik/cuda_fattn_Dk_Dv
jdelony:ik/flash_mla
jdelony:ik/smart_expert_selection
jdelony:ik/measure_barriers
jdelony:ik/reduce_compute_buffers
jdelony:ik/mla_no_transposed_cache
jdelony:ik/cuda_mla2
jdelony:ik/cuda_mla
jdelony:ik/buffer_type_overrides
jdelony:s6/rpc
jdelony:ik/issue_230
jdelony:ik/fused_up_gate_unary
jdelony:s6/sweep_bench
jdelony:ik/issue_224
jdelony:ik/issue_217
jdelony:ik/fuse_moe_up_gate
jdelony:ik/attn_gemm
jdelony:ik/fix_avx512_vs_fancy_simd
jdelony:ik/issue_214
jdelony:ik/fix_neon_legacy_quants
jdelony:ik/gemm_iq1s
jdelony:ik/q8_KV
jdelony:ik/repack_also_experts
jdelony:ik/gemm_4d
jdelony:ik/mla_q80
jdelony:ik/mla_fixes
jdelony:ik/fix_missing_bf16_avx512
jdelony:ik/fix_imatrix_nonsense
jdelony:ik/fattn_Dk_Dv
jdelony:s6/warmup
jdelony:ik/try_trellis
jdelony:ik/iqk_fattn_all_quants
jdelony:ik/mla
jdelony:s6/mla
jdelony:ik/iq1_s_r4_k128
jdelony:ik/revert_0bf4d997
jdelony:ik/iq1_s_checks
jdelony:ik/cuda_rms_non_contiguous
jdelony:ik/rename_4_8
jdelony:ik/iq1_m_r4
jdelony:ik/iq1_s_r4_neon
jdelony:ik/iq1_s_r4
jdelony:ik/qmix_tweaks_2
jdelony:ik/qx_k_b32_avx2
jdelony:ik/bench_gp
jdelony:ik/q4_0_r8
jdelony:ik/iq4_xs_r8_v2
jdelony:ik/chat_templates
jdelony:ik/gemv_bf16_r16
jdelony:ik/avx2_bf16
jdelony:ik/zen4_repack_f16
jdelony:ik/fattn_kqv
jdelony:ik/fattn_bf16
jdelony:ik/fix_fattn_odd_even
jdelony:ik/fix_mul_mat_16
jdelony:ik/convert_i2s
jdelony:ik/falcon3a
jdelony:ik/falcon3
jdelony:ik/cuda_q4_0_r4
jdelony:ik/mv_q4_0_r4
jdelony:ik/iq3_s_r4_v2
jdelony:ik/iq3_s_r4
jdelony:ik/fix_windows
jdelony:ik/qx_0_r4_avx2
jdelony:ik/r4_nrcy_16
jdelony:ik/iq2_s_r4
jdelony:ik/iq2_xs_r4
jdelony:ik/iq2_xxs_r4
jdelony:ik/iq3_xxs_r4_v2
jdelony:ik/iq3_xxs_r4
jdelony:ik/iq4_ks_r4
jdelony:ik/iq5_k_r4
jdelony:ik/avx2_r4_tweaks
jdelony:ik/run_time_repack
jdelony:ik/iq2_k_r4
jdelony:ik/iq3_k_r4_v2
jdelony:ik/iq4_k_r4_avx2
jdelony:ik/iq4_xs_r4_avx2
jdelony:ik/iq4_xs_r8
jdelony:ik/bf16_r4
jdelony:ik/q8_k_r8
jdelony:ik/r4_faster_zen4
jdelony:ik/iq4_k_r4
jdelony:ik/fix_avx2_iq4_nl_r4
jdelony:ik/q2_k_r4
jdelony:ik/arm_better_r4
jdelony:ik/q3_k_r4
jdelony:ik/q5_k_r4
jdelony:ik/q4_k_r4_v3
jdelony:ik/q6_k_r4
jdelony:ik/q4_k_r4_v2
jdelony:ik/zen4_iq4_xs_r4
jdelony:ik/rename_iq4_nl_x4
jdelony:ik/r4_neon
jdelony:ik/q4_k_r4
jdelony:ik/iq2_bn_r4
jdelony:ik/iq4_xs_r4
jdelony:ik/q6_0_r4
jdelony:ik/q5_0_r4
jdelony:ik/q8_0_r4
jdelony:ik/q4_0_r4
jdelony:ik/iq4_nl_x4
jdelony:ik/iq4kss_experiments
jdelony:ik/iq2ks_experiments
jdelony:ik/q60_mmq
jdelony:ik/faster_iq4k
jdelony:ik/multi_add
jdelony:ik/moe_fused_unary
jdelony:ik/bitnet_fused_unary
jdelony:ik/bitnet_cuda
jdelony:ik/bitnet_improve_metal
jdelony:ik/iq1bn_metal
jdelony:ik/adapt_iq1_iq2_bn
jdelony:ik/fix_quantized_k_cache
jdelony:ik/add_granite
jdelony:ik/fattn_enable_q6_0
jdelony:ik/fattn_enable_iq4_nl
jdelony:ik/bitnet_optional_scales
jdelony:ik/cached_graph
jdelony:ik/fix_reduce_windows
jdelony:ik/iq4_knn
jdelony:ik/iq4_kss
jdelony:ik/metal_faster_iq4ks
jdelony:ik/metal_fix_iq3k
jdelony:ik/metal_fix_iq2k
jdelony:ik/iq2k_experiments
jdelony:ik/better_model_info
jdelony:ik/iq3_ks
jdelony:ik/iq4_k_xxs
jdelony:ik/qstats
jdelony:ik/cleanup_fudge_factors
jdelony:ik/cpp_17
jdelony:ik/skip_unnecessary_quantize
jdelony:ik/faster_q60_avx2
jdelony:ik/fused_mul_unary
jdelony:ik/add_q60
jdelony:ik/faster_iq4nl_quantize
jdelony:ik/fix_q5_0_fa
jdelony:ik/iq4nl_kv_cache
jdelony:ik/cuda_faster_iq4nl_kvcache
jdelony:ik/better_iq4_nl
jdelony:ik/try_svd
jdelony:ik/better_iqk_strategy
jdelony:ik/bf16_kv_cache
jdelony:ik/fix_replace_all
jdelony:ik/non_contiguous_rope
jdelony:ik/swiglu
jdelony:ik/phi3.5_tweaks
jdelony:ik/play_with_barrier
jdelony:ik/per_row_scale
jdelony:ik/fix_metal_fa
jdelony:ik/fix_ggml_common
jdelony:ik/hsums
jdelony:ik/metal_bf16
jdelony:ik/neon_bf16
jdelony:ik/cuda_bf16
jdelony:ik/avx2_q5_0
jdelony:ik/avx2_q4_0_q8_0
jdelony:ik/qmix_tweaks
jdelony:ik/fix_kq
jdelony:ik/neon_flash_attention_3
jdelony:ik/avx2_flash_attn_2
jdelony:ik/neon_flash_attention_2
jdelony:ik/avx2_flash_attn
jdelony:ik/iq2_tn_avx2
jdelony:ik/iq2_tn_as_iq2_bn
jdelony:ik/iq1_tn_metal
jdelony:ik/iq1_tn_cuda
jdelony:ik/iq1_tn
jdelony:ik/iq2_tn_faster_pp
jdelony:ik/fused_rms_norm
jdelony:ik/mul_mat_bf16
jdelony:ik/zen4_flash_attn_bf16
jdelony:ik/neon_improve_legacy_quants
jdelony:ik/zen4_flash_attn_2
jdelony:ik/fix_flash_attn
jdelony:ik/fix_multiple_choice
jdelony:ik/zen4_flash_attn
jdelony:ik/kq_fused_softmax
jdelony:ik/fix_no_iqk_build
jdelony:ik/kq_mask
jdelony:ik/fused_softcap_softmax
jdelony:ik/softcap_minor
jdelony:ik/softcap
jdelony:ik/iq4_k_tweaks
jdelony:ik/quantize_q8k_avx2
jdelony:ik/quantize_stats
jdelony:ik/iq2_k_tweak
jdelony:ik/skip_noop_barriers
jdelony:ik/merge_Aug_12_2024
jdelony:ik/fix_Makefile
jdelony:ik/iq6_k
jdelony:ik/iq2_tn
jdelony:ik/trinet
jdelony:ik/faster_iq3_iq5_quantize
jdelony:ik/faster_iq4k_quantize
jdelony:ik/iq2_k
jdelony:ik/iq4_k
jdelony:ik/fuse_mul_mat_scale
jdelony:ik/merge_July_26_2024
jdelony:ik/bitnet_token_embedding_gpu_2
jdelony:ik/bitnet_token_embedding_gpu
jdelony:ik/mul_mat_ext
jdelony:ik/new_iq1bn
jdelony:t0002
...
compare: jdelony:t0002
jdelony:main
jdelony:ik/revert_dflash_swa_opt
jdelony:ik/dflash_tweaks
jdelony:ik/qwen35_mtp_smgraph
jdelony:ik/g4_assistant_smgraph
jdelony:ik/tensor_names
jdelony:fcp/checkpoint_min_var
jdelony:ik/purge_blas
jdelony:ik/gemma4_mtp_last_device
jdelony:ik/gemma4_mtp_graph_reuse
jdelony:ik/compat_g4_assistant
jdelony:ik/fix_gemma4_mtp
jdelony:ik/glm_mtp_warmup
jdelony:ik/fix_qwen_mtp_warmup
jdelony:ik/dflash_fix_smgraph
jdelony:ik/dflash_fix_cpu
jdelony:ik/fattn_mma_gqa_16
jdelony:ik/minimaxm3_smgraph
jdelony:ik/fix_1961
jdelony:ik/handle_think_no_space
jdelony:ik/mmq_show_error_details
jdelony:ik/cohere2_moe_graph_opt
jdelony:ik/gemma4_e2b_tweaks
jdelony:ik/fa_512_512_turing
jdelony:ik/bug_fixes_1926
jdelony:ik/laguna_sm_graph
jdelony:ik/fix_grt_bf16
jdelony:ik/alternative_gemma4_assistant
jdelony:ik/cpu_fa_disable_mask_opt
jdelony:ik/fa_gemma4_assistant
jdelony:ik/check_for_empty_mask
jdelony:ik/gemma4_12B_smgraph
jdelony:ik/mellum_sm_graph
jdelony:ik/mla_add_extra_nodes
jdelony:ik/quantize_gemma4
jdelony:ik/limit_amb
jdelony:ik/gemma4_mtmd_blindness
jdelony:ik/qwen_mtp_inp_out_ids
jdelony:ik/glm5_mtp
jdelony:ik/hadamard_block_size
jdelony:ik/fix_glm_mtp_smgraph
jdelony:ik/fix_glm_mtp_accept
jdelony:ik/fix_mla_smgraph_cache_load_save
jdelony:ik/disable_khadamard_if_not_power2
jdelony:ik/logging_cleanup
jdelony:ik/per_gpu_fit_margin
jdelony:ik/fix_partial_ngl_smgraph_mla
jdelony:ik/fix_partial_ngl_smgraph
jdelony:ik/mtp_accept_only_last_logits
jdelony:ik/fix_q35moe_mtp_smgraph
jdelony:ik/disable_smgraph_qwen35moe_mtp
jdelony:ik/fix_partial_offload_crash
jdelony:ik/fix_gemma_e4b
jdelony:ik/fix_mtp_no_gr
jdelony:ik/fix_mla1
jdelony:ik/rm_Makefile
jdelony:ik/fix_dst_backend
jdelony:ik/enable_smgraph_mla_hybrid
jdelony:ik/mla_smgraph
jdelony:ik/gemma4_mtp_extra_output
jdelony:ik/fix_qwen35moe_low_mtp_acceptance
jdelony:ik/fix_mtp_plus_muge
jdelony:ik/add_extra_output_tensor
jdelony:ik/mtp_requantize_output
jdelony:ik/imatrix_ffn_gate
jdelony:ik/faster_imatrix
jdelony:ik/fix_ggml_nbytes
jdelony:ik/mtp_tweaks_2
jdelony:ik/per_step_conv_states
jdelony:ik/gemma4_mtp_avoid_f32_cast
jdelony:ik/fix_glm_mtp
jdelony:fix-recurrent-ckpt-prealloc
jdelony:ik/mtp_reuse_graphs_2
jdelony:ik/avoid_per_step_ssm_copy
jdelony:ik/avoid_recurrent_state_copy
jdelony:ik/mtp_per_step_smgraph
jdelony:ik/fix_mistral3_smgraph
jdelony:ik/faster_per_step_restore
jdelony:ik/fast_sampling_avx2
jdelony:ik/mtp_async_copies
jdelony:ik/fix_mtp_discarding
jdelony:ik/mtp_tweaks1
jdelony:ik/better_mtp
jdelony:ik/minor_mtp1
jdelony:ik/set_draft_input_hidden_state
jdelony:ik/mimo2.5
jdelony:ik/disable_k_shift_smgraph
jdelony:ik/mtp_reuse_graphs
jdelony:ik/better_moe_small_batch
jdelony:revert-1696-fix/recurrent-state-reset
jdelony:ik/enable_cuda_graphs_with_reduce
jdelony:ik/disabled_cuda_graphs
jdelony:ik/revert_1687
jdelony:ik/better_fixup_stream_k
jdelony:ik/quantize_options
jdelony:ik/faster_iq2ks_quantize
jdelony:ik/mistral4_cpu_fa
jdelony:ik/fix_cuda_nans
jdelony:ik/fix_gemma4_hybrid
jdelony:ik/refactor_graphs
jdelony:ik/disallow_speculation_for_hybrid
jdelony:ik/try_minimax_better_sm_graph
jdelony:ik/cpu_mla_all_quants
jdelony:ik/gemma4_vision
jdelony:ik/fuse_rms_rms_add
jdelony:ik/fix_minimax_hadamard
jdelony:ik/graph_reuse_field
jdelony:ik/gemma4_routing
jdelony:ik/gemma4_fuse_logits
jdelony:ik/gemma4_gp_bugfix
jdelony:ik/gemma4_tokenizer_fixes
jdelony:ik/sm_graph_gemma4_moe
jdelony:ik/standardize_gemma4
jdelony:ik/mixd_kv_cache
jdelony:ik/hadamard_512
jdelony:ik/fix_gemma4_quantized_KV_cache_cuda
jdelony:ik/fix_gemma4_quantized_kv_cache_cpu
jdelony:ik/gemma4
jdelony:ik/pinned_suggest
jdelony:ik/bonsai_neon
jdelony:ik/bonsai_avx2
jdelony:ik/mtmd_kq_type
jdelony:ik/fix_unknown_tensor_type
jdelony:ik/fix_mmproj_bf16_cpu
jdelony:ik/check_cpu_fa_supported_types
jdelony:ik/fix_requantize_interleaved_2
jdelony:ik/worst_graph_tokens
jdelony:ik/better_q40_kv_cache_cpu
jdelony:ik/enable_all_iqk_fa_quants
jdelony:ik/better_q40_kv_cache
jdelony:ik/keep_mmap_with_no_pinned
jdelony:ik/llama_bench_fit
jdelony:ik/honor_manual_splits
jdelony:ik/llama_bench_sm_arg
jdelony:ik/v_cache_hadamard
jdelony:ik/fix_hadamard_bug
jdelony:ik/fix_cpu_fa_bf16
jdelony:ik/log_probs_on_crash
jdelony:ik/fix_jinja
jdelony:ik/warn_pinned_alloc
jdelony:ik/ignore_nextn
jdelony:ik/fix_bug_added_in_1506
jdelony:ikawrakow-patch-2
jdelony:ik/cuda_use_pinned_memory_2
jdelony:ik/cuda_use_pinned_memory
jdelony:ik/sm_graph_partial_offload
jdelony:ik/fit_dense_model
jdelony:ik/model_fit
jdelony:ik/revert_1496
jdelony:ik/gpu_layers_3
jdelony:ik/gpu_layers_2
jdelony:ik/cpu_swa_fa
jdelony:ik/fix_misleading_quantize_error
jdelony:ik/fancy_simd_log
jdelony:ik/fix_1478
jdelony:ik/gpu_layers
jdelony:ik/better_n_cpu_moe
jdelony:ik/fattn_fix_overflow
jdelony:ik/barrier
jdelony:ik/mistral4
jdelony:ik/q35_tweaks
jdelony:ik/rtr_plus_muge
jdelony:ik/ssm_conv4_silu
jdelony:ik/undo_1421
jdelony:ik/fix_1438
jdelony:ik/fix_1432
jdelony:ik/fix_llama_kv_cache_cell_max
jdelony:ik/delta_net_tweaks
jdelony:ik/faster_cpu_fused_rms1
jdelony:ik/faster_cpu_fused_rms
jdelony:ik/fix_hybrid_graph_muge
jdelony:ik/fuse_ssm_silu_neon
jdelony:ik/ot_ffn_gate_up
jdelony:ik/fdn_fuse_silu_cpu
jdelony:ik/quantize_fused_up_gate
jdelony:ik/imatrix_fused_up_gate
jdelony:ik/sampling_top_n_sigma
jdelony:ik/sm_graph_muge
jdelony:ik/sm_graph_pre_merged_up_gate
jdelony:ik/pre_merged_up_gate
jdelony:ik/ssm_conv4_avx2
jdelony:s6/imatrix_conv
jdelony:ik/qwen35moe_muge
jdelony:ik/cuda_ctx_mess
jdelony:ik/reset_1st_recurrent_graph
jdelony:ik/sm_graph_delta_net
jdelony:ik/fix_sm_graph_with_vision
jdelony:ik/qwen35_model_types
jdelony:ik/minor_silu
jdelony:ik/delta_dry
jdelony:ik/fix_qwen35_smgraph_hybrid
jdelony:ik/quantize_mmproj
jdelony:ik/disable_smgraph_recurrent
jdelony:ik/fused_delta_net_avx512
jdelony:ik/delta_net_neon
jdelony:ik/clang_warnings
jdelony:ik/simplify_delta_net_2
jdelony:ik/mtmd_reduce_memory_use
jdelony:ik/sm_graph_qwen35moe
jdelony:ik/qwen3.5_vision
jdelony:ik/qkvz_tweak1
jdelony:ik/fused_delta_net_3a
jdelony:ik/revert_delta_net_3
jdelony:ik/qkvz_tweak
jdelony:ik/simplify_delta_net
jdelony:ik/fused_delta_net_3
jdelony:ik/sm_graph_q35
jdelony:ik/slightly_better_fdn
jdelony:ik/qwen35_std_attn
jdelony:ik/fattn_q35dense
jdelony:ik/qwen35dense
jdelony:ik/faster_moe_quantize
jdelony:ik/fix_quantize_kt
jdelony:ik/fused_delta_net_2
jdelony:ik/fused_delta_net
jdelony:ik/quantize_dry_run
jdelony:ik/minor_delta_tweak
jdelony:ik/graph_parallel_tweak
jdelony:ik/max_nodes_again
jdelony:ik/fix_hybrid_detection
jdelony:ik/max_nodes
jdelony:ik/sm_graph_q3next
jdelony:ik/qwen35moe
jdelony:ik/delta_net
jdelony:ik/fix_imatrix_check
jdelony:ik/q3next_opt3
jdelony:ik/q3next_cuda_graphs
jdelony:ik/q3next_opt2
jdelony:ik/q3next_concat_cpu
jdelony:ik/q3next_concat
jdelony:ik/qwen3next
jdelony:ik/glm5
jdelony:ik/try_fix_1222
jdelony:ik/gguf_bool_arrays
jdelony:ik/step35_compat
jdelony:ik/fused_mul_unary_1
jdelony:ik/fix_graph_parallel_partial_offload
jdelony:ik/cpu_repeat
jdelony:ik/fix_1237
jdelony:ik/sm_graph_step35
jdelony:ik/change_default_fa_offset
jdelony:ik/step35
jdelony:ik/sm_graph_seedoss
jdelony:ik/fattn_gqa_10
jdelony:s6/seed_support2
jdelony:ik/cpu_moe_tg
jdelony:ik/fix_cpu_fa_work_buffer_size
jdelony:ik/cpu_fa_dont_repack_tg
jdelony:ik/better_cpu_fa_thread_strategy
jdelony:ik/reduce_mla3_compute_buffer_size
jdelony:ik/try_fix_1201
jdelony:ik/fix_1205
jdelony:ik/huihui_57B
jdelony:ik/minimax_graph_minor
jdelony:ik/fa_offset_2
jdelony:ik/fattn_kq_max_offset
jdelony:ik/minmax2_sm_graph
jdelony:ik/minimax2_very_fast
jdelony:ik/glm45_tg_very_fast
jdelony:ik/sync_fa
jdelony:ik/try_split_mla
jdelony:ik/glm47_fa_2
jdelony:ik/shexps_better_hybrid
jdelony:ik/better_fa_glm45
jdelony:ik/rng_sampling
jdelony:ik/glm45_tg_fa_hack
jdelony:ik/glm47_tg_fa_hack
jdelony:ik/remove_llamafile
jdelony:ik/sm_graph_cuda_graphs
jdelony:ik/fix_batched_cublas
jdelony:ik/sweep_bench_nrep
jdelony:ik/correct_missing_gating_func_comments
jdelony:ik/correct_glm47_flash_gating_func
jdelony:ik/cuda_graphs_with_overrides
jdelony:ik/fix_windows_no_omp
jdelony:ik/topk_moe_fuse_bias
jdelony:ik/glm_flash
jdelony:ik/sampling_refactor_sorting
jdelony:ik/adaptive_p_2
jdelony:ik/adaptive_p
jdelony:ik/fix_add_bf16_turing
jdelony:ik/skip_get_rows
jdelony:ik/reduce_make_copies
jdelony:ik/extra_reduce_types
jdelony:ik/try_fix_many_gpus_2
jdelony:ik/try_fix_many_gpus
jdelony:ik/fix_exp_shexp_split
jdelony:ik/llama_bench_overrides
jdelony:ik/llama_bench_sas
jdelony:ik/merge_up_gate_exps_3
jdelony:ik/merge_up_gate_exps_2
jdelony:ik/fuse_merge_up_gate_exps
jdelony:ik/try_authors
jdelony:ik/bailingmoe2_graph
jdelony:ik/deepseek_mla0
jdelony:ik/update_authors
jdelony:ik/fix_gpt_oss_partial_offload
jdelony:ik/graph_better_splits
jdelony:ik/fix_reduce_race
jdelony:ik/ernie_graph
jdelony:ik/dont_abort_on_nccl_init_failure
jdelony:ik/gpt_oss_graph
jdelony:ik/hunyuan_graph
jdelony:ik/mimo2_4_gpus
jdelony:ik/fix_ring_reduction
jdelony:ik/reduce_race_quick_fix
jdelony:ik/qwen3vl_graph
jdelony:ik/qwen3_graph
jdelony:ik/mimo2_graph
jdelony:ik/fix_fa_192_128
jdelony:ik/mimo2
jdelony:ik/graph_reuse_on
jdelony:ik/nccl3_async
jdelony:ik/more_set_device
jdelony:ik/ring_reduce
jdelony:ik/fix_no_p2p_case
jdelony:ik/reduce_no_nccl
jdelony:ik/split_mode_f32
jdelony:ik/fused_norm
jdelony:ik/nccl3
jdelony:ik/nccl2
jdelony:ik/nccl1
jdelony:ik/p2p_cpy_set_device
jdelony:ik/better_graph_pp
jdelony:ik/better_graph_tg
jdelony:ik/ignore_nextn_layers
jdelony:ik/cohere2_sm_graph
jdelony:ik/fix_sync_logic
jdelony:ik/undo_sync_reduction
jdelony:ik/undo_1049_if_tensor_overrides
jdelony:ik/fix_mmq_overflow
jdelony:ik/sm_graph_rearrange
jdelony:ik/disable_or_enable_p2p
jdelony:ik/fix_1055
jdelony:ik/fix_the_fix
jdelony:ik/sm_graph_max_gpu
jdelony:ik/fix_bench_compile
jdelony:ik/sm_graph_sync
jdelony:ik/try_split_offloaded_moe_up_gate
jdelony:ik/backend_reduce_syncs
jdelony:ik/split_graph_2
jdelony:ik/handle_split_cache
jdelony:ik/fix_annoying_warnings
jdelony:ik/sm_graph_disable_cuda_graphs
jdelony:ik/cuda_set_device
jdelony:ik/dont_split_output
jdelony:ik/fix_debug_build
jdelony:ik/mistral3_large
jdelony:ik/k_cache_hadamard_cuda
jdelony:ik/k_cache_hadamard
jdelony:ik/mistral3_std_attn
jdelony:ik/fix_cuda_scale_bug
jdelony:ik/ministral3
jdelony:ik/graph_alloc
jdelony:ik/allow_empty_splits
jdelony:ik/is_this_better_for_multi_gpu
jdelony:ik/slightly_better_graph_split_strategy
jdelony:ik/poc_tp_glm4.5
jdelony:ik/fix_rpc_off2
jdelony:ik/poc_tp
jdelony:ik/try_fix_1014
jdelony:ik/fix_1015
jdelony:fcp/fix_rpc_device
jdelony:ik/gguf_py_add_maxfp4
jdelony:ik/iq4_nl_cache
jdelony:ik/fix_q6_0_dequantize
jdelony:ik/disable_rope_cache
jdelony:ik/support_gigachat
jdelony:ik/wip_sync_llama
jdelony:ik/fix_requantize_interleaved
jdelony:ik/gguf_py_changes_for_np2.0
jdelony:ik/fix_kimi2_parse
jdelony:ik/disable_sm_row
jdelony:ik/try_fix_974
jdelony:ik/deepseek_guarantee_rope_fusion
jdelony:ik/topk_moe_with_norm
jdelony:ik/fused_rope_rope
jdelony:ik/add_vq_help
jdelony:fcp/context_shift_fix
jdelony:ik/gemma3_mqkv_rcache
jdelony:ik/fix_rtr_mqkv
jdelony:ik/deepseek_rope_cache
jdelony:ik/gemma_output_tensor
jdelony:ik/fix_fattn_supported
jdelony:ik/really_fix_rope_cache
jdelony:ik/add_jinja_file_help
jdelony:ik/graph_reuse
jdelony:ik/fix_up_gate_mmq_not_supported
jdelony:ik/fix_repacked_legacy_quants
jdelony:ik/llama_bench_mla3
jdelony:ik/fix_windows_avx512
jdelony:ik/fix_rope_norm_fast_cuda
jdelony:ik/fa_mainline_compat
jdelony:ik/mla=3_by_default
jdelony:ik/deepseek_merge_qk
jdelony:ik/enable_fusion_by_default
jdelony:ik/iqk_mmvq_opt
jdelony:ik/llama_bench_n_cpu_moe
jdelony:ik/llama_bench_rcache
jdelony:ik/remove_unnecessary_calls
jdelony:ik/smollm3
jdelony:ik/deepseek_fa_opt
jdelony:ik/fuse_bias_only_tg
jdelony:ik/make_biased_gemv_optional
jdelony:ik/deepseek_opt
jdelony:ik/use_mmq_id_for_moe
jdelony:ik/fuse_kvcache_copy
jdelony:ik/another_mmq_id_fix
jdelony:ik/disable_add_fused_rms
jdelony:ik/fix_mmq_id
jdelony:ik/fix_iqk_for_strange_numrows
jdelony:ik/cuda_params
jdelony:ik/disable_fusion_by_default
jdelony:ik/option_to_disable_cuda_fusion
jdelony:ik/fix_after_883
jdelony:ik/cpu_fa_tg_glm4.5
jdelony:ik/sweep_bench_n_predict
jdelony:ik/quantize_ffn_gate_inp
jdelony:ik/merge_only_qk
jdelony:ik/disable_some_fusion
jdelony:ik/rope_cache
jdelony:ik/cuda_lto
jdelony:ik/cuda_rope_back
jdelony:ik/fused_rms_rms
jdelony:ik/biased_mmvq
jdelony:ik/merge_qkv
jdelony:ik/fattn_is_supported
jdelony:ik/try_remove_cpy_indirection
jdelony:ik/fuse_biased_qkv
jdelony:ik/biased_qkv
jdelony:ik/reorg_mmvq_and_fuse_bias
jdelony:ik/change_fmoe_fa_defaults
jdelony:ik/mmvq_args
jdelony:ik/mmvq_fuse_bias
jdelony:ik/format_name
jdelony:ik/fused_mul_multiadd
jdelony:ik/fix_experts_node_name
jdelony:ik/fuse_add_add_fused_rms
jdelony:ik/try_fix_854
jdelony:ik/fuse_add_fused_rms
jdelony:ik/fix_fused_grouped_topk
jdelony:ik/rms_block_size
jdelony:ik/debug_849
jdelony:ik/fix_pr_842
jdelony:ik/no_KV_for_unused_layers
jdelony:ik/ooae_on_by_default
jdelony:ik/fused_bailingmoev2
jdelony:ik/n_cpu_moe
jdelony:ik/cuda_grouped_topk
jdelony:ik/try_grouped_topk_playing1
jdelony:ik/cpu_argsort
jdelony:ik/bailingmoe2
jdelony:ik/dup_experts_bias
jdelony:ik/fix_827
jdelony:ik/mask_mt
jdelony:ik/fix_perf_regression
jdelony:ik/llama_warnings
jdelony:ik/refactor_llama.cpp
jdelony:ik/debug_issue_733
jdelony:ik/try_fix_avx2_fa
jdelony:ik/fix_gemma3_vision
jdelony:ik/vendor
jdelony:ik/dedup_stb_image
jdelony:ik/add_mtmd
jdelony:ik/better_fa_masking
jdelony:ik/fix_dequantize_when_requantizing
jdelony:ik/fuse_qkv
jdelony:ik/cpu_topk_moe
jdelony:ik/try_fix_772
jdelony:ik/cuda_topk_moe
jdelony:ik/fix_compiler_warnings
jdelony:ik/ooae2
jdelony:ik/fix_contiguously_allocated
jdelony:ik/cpu_swa_v2
jdelony:ik/cuda_swa3
jdelony:ik/sched_copy_experts
jdelony:ik/cuda_swa2
jdelony:ik/sched_max_copies=1
jdelony:ik/revert_739
jdelony:ik/cuda_refactor_fattn
jdelony:s6/fix_prompt_tokenization
jdelony:ik/fused_ffn_up_gate
jdelony:ik/fix_missing_end
jdelony:ik/skip_rowids_computation
jdelony:ik/optional_yarn_log_multiplier
jdelony:ik/sanitize_importance_iqk
jdelony:ik/validate_quants_on_load
jdelony:ik/mmq_id_thresh
jdelony:ik/fix_avx2_gemm_mess
jdelony:ik/add_mmq_id
jdelony:s6/mikupad
jdelony:ik/debug_issue_721
jdelony:ik/sanitize_importance_kt_quants
jdelony:ik/fix_q80_avx2_2
jdelony:ik/remove_scary_warning
jdelony:ik/cuda_iq2k_use_bperm1
jdelony:ik/cuda_iq3k_use_bperm1
jdelony:ik/cuda_use_bperm
jdelony:ik/q8_k_r16
jdelony:ik/try_fix_690
jdelony:ik/disable_vocab_debug
jdelony:ik/fix_q80_avx2_mess
jdelony:ik/fix_q80_moe_avx2
jdelony:ik/disable_experimental_code1
jdelony:ik/cpu_swa_v1
jdelony:ik/reverts
jdelony:ik/fix_glm4_attn
jdelony:ik/cpu_swa_v0
jdelony:ik/try_cuda_graphs
jdelony:ik/gpt-oss
jdelony:s6/fix_kshift_crash
jdelony:ik/mxfp4
jdelony:ik/fix_quantized_kv_nofa
jdelony:ik/vulkan1
jdelony:ik/iq4_kss_improvements
jdelony:ik/fix_comma_pauses
jdelony:ik/iq1_m_neon
jdelony:ik/iq1m_gemm
jdelony:ik/iq1_kt
jdelony:ik/quantization_tweaks
jdelony:ik/q8_k_r8_avx512
jdelony:ik/vulkan_again
jdelony:ik/iq2_kl
jdelony:ik/add_iq3ks_to_gguf
jdelony:ik/fix_596
jdelony:s6/dots
jdelony:s6/readme-minor2
jdelony:ik/apply_cuda_faster_iq3k
jdelony:ik/cuda_faster_iq2k
jdelony:ik/cuda_quantized_fmoe
jdelony:ik/vulkan_fattn
jdelony:ik/add_forgotten_multi_add
jdelony:ik/vulkan_multi_add
jdelony:ik/vulkan_disable_multi_add
jdelony:ik/vulkan_fused_mul_unary
jdelony:ik/fix_rpc_off
jdelony:ik/fix_missing_dry
jdelony:ik/vulkan_fused_rms
jdelony:ik/kq_mask_padding_64
jdelony:ik/fix_vulkan_required
jdelony:ik/iq3_ks_v2
jdelony:ik/vulkan_disable_fused_ops
jdelony:ik/improve_mmq
jdelony:ik/cuda_large_cpy
jdelony:ik/mmq_to_cublas
jdelony:ik/cuda_iqk_r4
jdelony:ik/falcon_edge
jdelony:ik/gemm_neon_1bit
jdelony:ik/gemm_neon_kquants
jdelony:ik/gemm_neon_iquants
jdelony:ik/gemm_neon_iqk
jdelony:ik/gemm_neon_legacy
jdelony:ik/metal_new_trellis
jdelony:ik/trellis_opt
jdelony:ik/neon_iq3_kt
jdelony:ik/fix_neon_build
jdelony:ik/fix_538
jdelony:s6/readme-minor1
jdelony:ik/new_iq2kt_v2
jdelony:ik/legacy_gemm
jdelony:ik/iqk_gemm
jdelony:ik/q6_k_gemm
jdelony:ik/fix_bug_481
jdelony:s6/readme_update
jdelony:ik/q4_k_gemm
jdelony:ik/iq_gemv_tweaks
jdelony:ik/moe_offload_strategy
jdelony:ik/iq3_s_gemm
jdelony:ik/iq1_s_gemm
jdelony:ik/iq3_xxs_gemm
jdelony:ik/iq2_xxs_gemm
jdelony:ik/new_iq2kt
jdelony:s6/docs_update
jdelony:ik/new_iq4kt
jdelony:s6/list_prompt_cache
jdelony:ik/fix_499
jdelony:ik/new_trellis_2
jdelony:ik/check_up_gate_fmoe
jdelony:s6/MLA_prompt_save_restore_fix
jdelony:ik/llama_hparams_add_mla
jdelony:ik/cuda_iq1_m_r4
jdelony:ik/mmq_iq_ks_r4
jdelony:ik/cuda_iq1_s_r4
jdelony:ik/sampling-top-n-sigma
jdelony:ik/dequant_moe_gemm
jdelony:ik/mmvq_type_supported
jdelony:ik/sampling-xtc
jdelony:ik/trellis_bf16
jdelony:ik/trellis_metal
jdelony:ik/repack_f16
jdelony:ik/dequant_gemm
jdelony:ik/remove_kv_l
jdelony:s6/remove_kv_l
jdelony:ik/trellis_neon
jdelony:ik/server_send_done
jdelony:ik/minor_iq2ks_tweak
jdelony:s6/cache_default
jdelony:ik/cuda_iqk_ks_r4
jdelony:ik/cuda_iq4_k_r4
jdelony:ik/add_missing_gguf_constants
jdelony:ik/remove_iqk_option
jdelony:s6/fp8_native
jdelony:ik/opt_kt_quants
jdelony:ik/fix_447
jdelony:ik/fix_mmvq_bug
jdelony:ik/fix_typo
jdelony:ik/cuda_tracer
jdelony:ik/andrew_trellis
jdelony:ik/desperate_bug_fix_attempt
jdelony:ik/cuda_mailine_fixes
jdelony:ik/refactor_iqk
jdelony:ik/disable_multi_add
jdelony:ik/option_cpu_fa
jdelony:ik/zen4_faster_iq4ks_iq5ks
jdelony:ik/iq5_ks_r4
jdelony:ik/fix_iq4k_avx2
jdelony:ik/add_missing_mmq_iq5ks
jdelony:ik/iq5_ks
jdelony:ik/fix_standard_attention_cpu
jdelony:ik/cuda_mmq_iq2_k
jdelony:ik/cuda_mmq_iq4_k
jdelony:ik/fix_ser_cuda
jdelony:ik/fix_ser
jdelony:ik/fix_412
jdelony:ik/fix_mla_imatrix
jdelony:ik/cpu_deepseek_fa
jdelony:ik/enable_mla3_in_crippled_ggufs
jdelony:ik/cuda_flash_mla3_v2
jdelony:ik/fix_cuda_fa_race
jdelony:ik/offload_policy
jdelony:ik/remove_unnessessary_ids_copy
jdelony:s6/rope_freq_fix
jdelony:ik/cuda_fix_quantized_flash_mla3
jdelony:ik/handle_incompatible_deepseek_ggufs
jdelony:ik/fix_deepseek_q80_cache
jdelony:ik/fix_xeon_6226R
jdelony:ik/cuda_flash_mla3
jdelony:s6/deci_support
jdelony:ik/fix_deepseek_fattn
jdelony:ik/sweep_bench_warmup
jdelony:ik/cuda_mmq_iq4_ks
jdelony:ik/try_fix_367_v2
jdelony:ik/fattn_mma
jdelony:ik/try_fix_367
jdelony:s6/bitnet_name_update
jdelony:ik/fix_fa_avx2_bug
jdelony:s6/qwen3_dynamic_yarn
jdelony:ikawrakow-patch-1-1
jdelony:ik/fix_358
jdelony:ik/add_missing_enum_values_qwen3
jdelony:ikawrakow-patch-1
jdelony:ik/fattn_work_buffer
jdelony:ik/fix_div_zero
jdelony:ik/fix_q41_q51_arm
jdelony:ik/cohere2
jdelony:ik/arch_flags
jdelony:ik/fix_arm_fa
jdelony:ik/pickup_13095
jdelony:ik/fix_llama4_attention
jdelony:s6/fix_python
jdelony:ik/bitnet_adjustments
jdelony:s6/bitnet2b_2501
jdelony:s6/termux_fix
jdelony:ik/tg_tweaks
jdelony:ik/faster_avx2_q40
jdelony:ik/gemma_q80_kvcache
jdelony:ik/imatrix_lsim
jdelony:ik/hide_imatrix
jdelony:ik/improve_iq1m
jdelony:ik/fix_kld
jdelony:ik/l4_rms_norm
jdelony:ik/llama4
jdelony:ik/improve_iq2ks
jdelony:ik/mla_guard
jdelony:ik/update_license
jdelony:ik/copyright
jdelony:ik/try_fa_no_q80_repack
jdelony:ik/fix_cuda_memcpy_async
jdelony:ik/improve_iq2_xs
jdelony:ik/flax-vector-conversions
jdelony:ik/metal_fattn_update
jdelony:ik/fix_gcc_arm
jdelony:ik/metal_moe
jdelony:ik/fix_neon_q82
jdelony:ik/iqk_q_improvements
jdelony:ik/fix_300
jdelony:ik/interleaved_guards
jdelony:ik/make_qx_quants
jdelony:ik/change_q_pure
jdelony:ik/use_q8_2
jdelony:ik/test_q80_NaNs
jdelony:s6/numa_KV
jdelony:s6/sweep_bench_update
jdelony:ik/deepseek_is_this_better
jdelony:ik/llama_bench_tgb
jdelony:ik/cuda_better_moe
jdelony:ik/better_batched_processing
jdelony:ik/test_thp
jdelony:ik/cuda_native
jdelony:ik/fix_again_cmake
jdelony:ik/better_flash_mla
jdelony:ik/gemma3
jdelony:ik/bug_missing_parentheses
jdelony:ik/offline_repack_patterns
jdelony:ik/FlashMLA-3
jdelony:ik/offline_repack
jdelony:ik/tensor_override_honor_mmap
jdelony:ik/fix_dup_q
jdelony:ik/avoid_cuda_mla_1
jdelony:ik/mla2_q80_cache_cpu
jdelony:ik/mla2_q80_cache
jdelony:ik/fix_pr_261
jdelony:ik/use_bf16_when_no_mmq
jdelony:ik/flash_mla2_cuda_no_f32
jdelony:ik/prepare_wk_b
jdelony:ik/flash_mla2_no_f32
jdelony:ik/cuda_flash_mla_q8_0
jdelony:ik/flash_precision
jdelony:ik/mla_imatrix
jdelony:ik/cuda_faster_moe_tg
jdelony:ik/flash_mla_4
jdelony:ik/flash_mla_2
jdelony:ik/custom_q_rules
jdelony:ik/better_tg_fattn
jdelony:ik/cuda_fattn_Dk_Dv
jdelony:ik/flash_mla
jdelony:ik/smart_expert_selection
jdelony:ik/measure_barriers
jdelony:ik/reduce_compute_buffers
jdelony:ik/mla_no_transposed_cache
jdelony:ik/cuda_mla2
jdelony:ik/cuda_mla
jdelony:ik/buffer_type_overrides
jdelony:s6/rpc
jdelony:ik/issue_230
jdelony:ik/fused_up_gate_unary
jdelony:s6/sweep_bench
jdelony:ik/issue_224
jdelony:ik/issue_217
jdelony:ik/fuse_moe_up_gate
jdelony:ik/attn_gemm
jdelony:ik/fix_avx512_vs_fancy_simd
jdelony:ik/issue_214
jdelony:ik/fix_neon_legacy_quants
jdelony:ik/gemm_iq1s
jdelony:ik/q8_KV
jdelony:ik/repack_also_experts
jdelony:ik/gemm_4d
jdelony:ik/mla_q80
jdelony:ik/mla_fixes
jdelony:ik/fix_missing_bf16_avx512
jdelony:ik/fix_imatrix_nonsense
jdelony:ik/fattn_Dk_Dv
jdelony:s6/warmup
jdelony:ik/try_trellis
jdelony:ik/iqk_fattn_all_quants
jdelony:ik/mla
jdelony:s6/mla
jdelony:ik/iq1_s_r4_k128
jdelony:ik/revert_0bf4d997
jdelony:ik/iq1_s_checks
jdelony:ik/cuda_rms_non_contiguous
jdelony:ik/rename_4_8
jdelony:ik/iq1_m_r4
jdelony:ik/iq1_s_r4_neon
jdelony:ik/iq1_s_r4
jdelony:ik/qmix_tweaks_2
jdelony:ik/qx_k_b32_avx2
jdelony:ik/bench_gp
jdelony:ik/q4_0_r8
jdelony:ik/iq4_xs_r8_v2
jdelony:ik/chat_templates
jdelony:ik/gemv_bf16_r16
jdelony:ik/avx2_bf16
jdelony:ik/zen4_repack_f16
jdelony:ik/fattn_kqv
jdelony:ik/fattn_bf16
jdelony:ik/fix_fattn_odd_even
jdelony:ik/fix_mul_mat_16
jdelony:ik/convert_i2s
jdelony:ik/falcon3a
jdelony:ik/falcon3
jdelony:ik/cuda_q4_0_r4
jdelony:ik/mv_q4_0_r4
jdelony:ik/iq3_s_r4_v2
jdelony:ik/iq3_s_r4
jdelony:ik/fix_windows
jdelony:ik/qx_0_r4_avx2
jdelony:ik/r4_nrcy_16
jdelony:ik/iq2_s_r4
jdelony:ik/iq2_xs_r4
jdelony:ik/iq2_xxs_r4
jdelony:ik/iq3_xxs_r4_v2
jdelony:ik/iq3_xxs_r4
jdelony:ik/iq4_ks_r4
jdelony:ik/iq5_k_r4
jdelony:ik/avx2_r4_tweaks
jdelony:ik/run_time_repack
jdelony:ik/iq2_k_r4
jdelony:ik/iq3_k_r4_v2
jdelony:ik/iq4_k_r4_avx2
jdelony:ik/iq4_xs_r4_avx2
jdelony:ik/iq4_xs_r8
jdelony:ik/bf16_r4
jdelony:ik/q8_k_r8
jdelony:ik/r4_faster_zen4
jdelony:ik/iq4_k_r4
jdelony:ik/fix_avx2_iq4_nl_r4
jdelony:ik/q2_k_r4
jdelony:ik/arm_better_r4
jdelony:ik/q3_k_r4
jdelony:ik/q5_k_r4
jdelony:ik/q4_k_r4_v3
jdelony:ik/q6_k_r4
jdelony:ik/q4_k_r4_v2
jdelony:ik/zen4_iq4_xs_r4
jdelony:ik/rename_iq4_nl_x4
jdelony:ik/r4_neon
jdelony:ik/q4_k_r4
jdelony:ik/iq2_bn_r4
jdelony:ik/iq4_xs_r4
jdelony:ik/q6_0_r4
jdelony:ik/q5_0_r4
jdelony:ik/q8_0_r4
jdelony:ik/q4_0_r4
jdelony:ik/iq4_nl_x4
jdelony:ik/iq4kss_experiments
jdelony:ik/iq2ks_experiments
jdelony:ik/q60_mmq
jdelony:ik/faster_iq4k
jdelony:ik/multi_add
jdelony:ik/moe_fused_unary
jdelony:ik/bitnet_fused_unary
jdelony:ik/bitnet_cuda
jdelony:ik/bitnet_improve_metal
jdelony:ik/iq1bn_metal
jdelony:ik/adapt_iq1_iq2_bn
jdelony:ik/fix_quantized_k_cache
jdelony:ik/add_granite
jdelony:ik/fattn_enable_q6_0
jdelony:ik/fattn_enable_iq4_nl
jdelony:ik/bitnet_optional_scales
jdelony:ik/cached_graph
jdelony:ik/fix_reduce_windows
jdelony:ik/iq4_knn
jdelony:ik/iq4_kss
jdelony:ik/metal_faster_iq4ks
jdelony:ik/metal_fix_iq3k
jdelony:ik/metal_fix_iq2k
jdelony:ik/iq2k_experiments
jdelony:ik/better_model_info
jdelony:ik/iq3_ks
jdelony:ik/iq4_k_xxs
jdelony:ik/qstats
jdelony:ik/cleanup_fudge_factors
jdelony:ik/cpp_17
jdelony:ik/skip_unnecessary_quantize
jdelony:ik/faster_q60_avx2
jdelony:ik/fused_mul_unary
jdelony:ik/add_q60
jdelony:ik/faster_iq4nl_quantize
jdelony:ik/fix_q5_0_fa
jdelony:ik/iq4nl_kv_cache
jdelony:ik/cuda_faster_iq4nl_kvcache
jdelony:ik/better_iq4_nl
jdelony:ik/try_svd
jdelony:ik/better_iqk_strategy
jdelony:ik/bf16_kv_cache
jdelony:ik/fix_replace_all
jdelony:ik/non_contiguous_rope
jdelony:ik/swiglu
jdelony:ik/phi3.5_tweaks
jdelony:ik/play_with_barrier
jdelony:ik/per_row_scale
jdelony:ik/fix_metal_fa
jdelony:ik/fix_ggml_common
jdelony:ik/hsums
jdelony:ik/metal_bf16
jdelony:ik/neon_bf16
jdelony:ik/cuda_bf16
jdelony:ik/avx2_q5_0
jdelony:ik/avx2_q4_0_q8_0
jdelony:ik/qmix_tweaks
jdelony:ik/fix_kq
jdelony:ik/neon_flash_attention_3
jdelony:ik/avx2_flash_attn_2
jdelony:ik/neon_flash_attention_2
jdelony:ik/avx2_flash_attn
jdelony:ik/iq2_tn_avx2
jdelony:ik/iq2_tn_as_iq2_bn
jdelony:ik/iq1_tn_metal
jdelony:ik/iq1_tn_cuda
jdelony:ik/iq1_tn
jdelony:ik/iq2_tn_faster_pp
jdelony:ik/fused_rms_norm
jdelony:ik/mul_mat_bf16
jdelony:ik/zen4_flash_attn_bf16
jdelony:ik/neon_improve_legacy_quants
jdelony:ik/zen4_flash_attn_2
jdelony:ik/fix_flash_attn
jdelony:ik/fix_multiple_choice
jdelony:ik/zen4_flash_attn
jdelony:ik/kq_fused_softmax
jdelony:ik/fix_no_iqk_build
jdelony:ik/kq_mask
jdelony:ik/fused_softcap_softmax
jdelony:ik/softcap_minor
jdelony:ik/softcap
jdelony:ik/iq4_k_tweaks
jdelony:ik/quantize_q8k_avx2
jdelony:ik/quantize_stats
jdelony:ik/iq2_k_tweak
jdelony:ik/skip_noop_barriers
jdelony:ik/merge_Aug_12_2024
jdelony:ik/fix_Makefile
jdelony:ik/iq6_k
jdelony:ik/iq2_tn
jdelony:ik/trinet
jdelony:ik/faster_iq3_iq5_quantize
jdelony:ik/faster_iq4k_quantize
jdelony:ik/iq2_k
jdelony:ik/iq4_k
jdelony:ik/fuse_mul_mat_scale
jdelony:ik/merge_July_26_2024
jdelony:ik/bitnet_token_embedding_gpu_2
jdelony:ik/bitnet_token_embedding_gpu
jdelony:ik/mul_mat_ext
jdelony:ik/new_iq1bn
jdelony:t0002
The selected branch/tag are equal.