Allow bad words filter to ban <|endoftext|> token

The official transformers bad words filter doesn't allow this by default. Finetune's version does allow this by default, however.
2025-06-05 21:59:24 +02:00 · 2021-11-27 11:40:34 -05:00
parent 2bc93ba37a
commit 9f51c42dd4
1 changed files with 8 additions and 0 deletions
--- a/aiserver.py
+++ b/aiserver.py
@@ -655,6 +655,14 @@ if(not vars.model in ["InferKit", "Colab", "OAI", "ReadOnly", "TPUMeshTransforme
        transformers.generation_utils.GenerationMixin.sample = new_sample


+        # Allow bad words filter to ban <|endoftext|> token
+        import transformers.generation_logits_process
+        def new_init(self, bad_words_ids: List[List[int]], eos_token_id: int):
+            return new_init.old_init(self, bad_words_ids, -1)
+        new_init.old_init = transformers.generation_logits_process.NoBadWordsLogitsProcessor.__init__
+        transformers.generation_logits_process.NoBadWordsLogitsProcessor.__init__ = new_init
+
+
        # Sets up dynamic world info scanner
        class DynamicWorldInfoScanCriteria(StoppingCriteria):
            def __init__(