Fix ntk alpha

2025-06-05 21:59:24 +02:00 · 2023-07-23 21:56:48 +02:00
parent 31a984aa3d
commit 49740aa5ab
1 changed files with 1 additions and 0 deletions
--- a/modeling/inference_models/exllama/class.py
+++ b/modeling/inference_models/exllama/class.py
@@ -430,6 +430,7 @@ class model_backend(InferenceModel):
        self.model_config.max_seq_len = parameters["max_ctx"]
        self.model_config.compress_pos_emb = parameters["compress_emb"]
        self.model_config.alpha_value = parameters["ntk_alpha"]
+        self.model_config.calculate_rotary_embedding_base()

        # Disable half2 for HIP
        self.model_config.rmsnorm_no_half2 = bool(torch.version.hip)