Merge pull request #19 from henk7171/accelerate-offloading

Remove wrong usegpu behavior
2025-06-05 21:59:24 +02:00 · 2023-06-22 15:05:03 -05:00
parent 5ee20bd7d6 1da4580e8b
commit e62e3560bf
1 changed files with 0 additions and 5 deletions
--- a/modeling/inference_models/hf_torch.py
+++ b/modeling/inference_models/hf_torch.py
@@ -114,9 +114,6 @@ class HFTorchInferenceModel(HFInferenceModel):
            self.breakmodel_config.gpu_blocks = self.layers
            self.breakmodel_config.disk_blocks = self.disk_layers
        # HACK: Prevent get_auxiliary_device from returning cuda
        utils.koboldai_vars.hascuda = self.usegpu
        return ret
    def _get_target_dtype(self) -> Union[torch.float16, torch.float32]:
@@ -124,8 +121,6 @@ class HFTorchInferenceModel(HFInferenceModel):
            return torch.float32
        elif utils.args.cpu:
            return torch.float32
        elif not self.usegpu:
            return torch.float32
        return torch.float16
    def _apply_warpers(