Fix legacy model loading

2025-06-05 21:59:24 +02:00 · 2023-04-15 12:57:35 -05:00
parent 2a977feb3e
commit 4dcf570407
4 changed files with 36 additions and 16 deletions
--- a/aiserver.py
+++ b/aiserver.py
@@ -11,6 +11,8 @@ from enum import Enum
 import random
 import shutil
 import eventlet
+
+from modeling.inference_model import SuperLegacyModelError
 eventlet.monkey_patch(all=True, thread=False, os=False)
 import os, inspect
 os.system("")
@@ -1942,24 +1944,31 @@ def load_model(use_gpu=True, gpu_layers=None, disk_layers=None, initial_load=Fal
            except:
                pass

-        if koboldai_vars.model_type == "gpt2":
-            from modeling.inference_models.legacy_gpt2_hf import CustomGPT2HFTorchInferenceModel
-            model = CustomGPT2HFTorchInferenceModel(
-                koboldai_vars.model,
-                lazy_load=koboldai_vars.lazy_load,
-                low_mem=args.lowmem
-            )
-        else:
+        try:
            from modeling.inference_models.generic_hf_torch import GenericHFTorchInferenceModel
            model = GenericHFTorchInferenceModel(
                koboldai_vars.model,
                lazy_load=koboldai_vars.lazy_load,
                low_mem=args.lowmem
            )
-        model.load(
-            save_model=not (args.colab or args.cacheonly) or args.savemodel,
-            initial_load=initial_load,
-        )
+
+            model.load(
+                save_model=not (args.colab or args.cacheonly) or args.savemodel,
+                initial_load=initial_load,
+            )
+        except SuperLegacyModelError:
+            from modeling.inference_models.legacy_gpt2_hf import CustomGPT2HFTorchInferenceModel
+            model = CustomGPT2HFTorchInferenceModel(
+                koboldai_vars.model,
+                lazy_load=koboldai_vars.lazy_load,
+                low_mem=args.lowmem
+            )
+
+            model.load(
+                save_model=not (args.colab or args.cacheonly) or args.savemodel,
+                initial_load=initial_load,
+            )
+
        logger.info(f"Pipeline created: {koboldai_vars.model}")
    else:
        # TPU