breakmodel fix for models without lm_head

2025-06-05 21:59:24 +02:00 · 2021-08-20 19:32:18 -04:00
parent 8bfcf86a8b
commit e00d9c4362
1 changed files with 4 additions and 2 deletions
--- a/aiserver.py
+++ b/aiserver.py
@ -383,9 +383,10 @@ if(not vars.model in ["InferKit", "Colab", "OAI", "ReadOnly"]):
                    breakmodel.total_blocks = n_layers
                    model.half().to('cpu')
                    gc.collect()
-                    model.lm_head.to(breakmodel.gpu_device)
                    model.transformer.wte.to(breakmodel.gpu_device)
                    model.transformer.ln_f.to(breakmodel.gpu_device)
+                    if(hasattr(model), 'lm_head'):
+                        model.lm_head.to(breakmodel.gpu_device)
                    if(not hasattr(model.config, 'rotary') or not model.config.rotary):
                        model.transformer.wpe.to(breakmodel.gpu_device)
                    gc.collect()
@ -433,9 +434,10 @@ if(not vars.model in ["InferKit", "Colab", "OAI", "ReadOnly"]):
                    breakmodel.total_blocks = n_layers
                    model.half().to('cpu')
                    gc.collect()
-                    model.lm_head.to(breakmodel.gpu_device)
                    model.transformer.wte.to(breakmodel.gpu_device)
                    model.transformer.ln_f.to(breakmodel.gpu_device)
+                    if(hasattr(model), 'lm_head'):
+                        model.lm_head.to(breakmodel.gpu_device)
                    if(not hasattr(model.config, 'rotary') or not model.config.rotary):
                        model.transformer.wpe.to(breakmodel.gpu_device)
                    gc.collect()