server: fix router args not being forwarded to child instances (#24760)

2026-06-27 23:50:20 -05:00 · 2026-06-18 12:15:46 +02:00 · 2026-06-18 12:15:46 +02:00 · 968c43891a
commit 968c43891a
parent 24bba7b98e
1 changed files with 6 additions and 0 deletions
--- a/tools/server/server-models.cpp
+++ b/tools/server/server-models.cpp
@ -351,6 +351,12 @@ void server_models::load_models() {
        source_map[name] = SERVER_MODEL_SOURCE_PRESET;
    }

+    // overlay router's own CLI args on top of every model preset so that
+    // e.g. `llama-server --temp 0` is honoured by all child processes
+    for (auto & [name, preset] : final_presets) {
+        preset.merge(base_preset);
+    }
+
    auto get_source = [&](const std::string & name) {
        return source_map.count(name) ? source_map.at(name) : SERVER_MODEL_SOURCE_PRESET;
    };