Merge pull request #205 from VE-FORBRYDERNE/hidden-size

Fix hidden size calculation for GPT-NeoX models
2022-09-07 22:57:29 +02:00 · 2022-09-07 22:57:29 +02:00 · 4851c1dd46
parent 8bbb9ff761 153f6b6c92
commit 4851c1dd46
1 changed files with 1 additions and 13 deletions
--- a/aiserver.py
+++ b/aiserver.py
@ -2370,19 +2370,7 @@ def load_model(use_gpu=True, gpu_layers=None, disk_layers=None, initial_load=Fal


            def get_hidden_size_from_model(model):
-                try:
-                    return int(model.model.decoder.project_in.in_features)
-                except:
-                    try:
-                        return int(model.model.decoder.embed_tokens.out_features)
-                    except:
-                        try:
-                            return int(model.transformer.hidden_size)
-                        except:
-                            try:
-                                return int(model.transformer.embed_dim)
-                            except:
-                                return int(model.lm_head.in_features)
+                return model.get_input_embeddings().embedding_dim
            
            def maybe_low_cpu_mem_usage() -> Dict[str, Any]:
                if(packaging.version.parse(transformers_version) < packaging.version.parse("4.11.0")):