Fix token streaming

2025-06-05 21:59:24 +02:00 · 2022-09-17 20:47:44 -05:00
parent 30901b81e9
commit 386477e59c
1 changed files with 2 additions and 7 deletions
--- a/aiserver.py
+++ b/aiserver.py
@@ -2009,11 +2009,8 @@ def patch_transformers():

            if not koboldai_vars.output_streaming:
                return False
-            
-            print([utils.decodenewlines(tokenizer.decode(x[-1])) for x in input_ids])

            koboldai_vars.actions.stream_tokens([utils.decodenewlines(tokenizer.decode(x[-1])) for x in input_ids])
-
            return False

    # Sets up dynamic world info scanner
@@ -4744,7 +4741,6 @@ def calcsubmit(txt):
            "TPUMeshTransformerGPTNeoX"
        ):
            legacy_generate(subtxt, min, max)
-            # generate(subtxt, min, max, found_entries=found_entries)
        elif koboldai_vars.model == "Colab":
            sendtocolab(utils.decodenewlines(tokenizer.decode(subtxt)), min, max)
        elif koboldai_vars.model == "API":
@@ -4813,11 +4809,10 @@ def calcsubmit(txt):
        ikrequest(subtxt)

 def legacy_generate(text: Union[str, list], min: int, max: int):
-    # Architected after oairequest
-
    koboldai_vars.lastctx = text

-    outputs = raw_generate(
+    outputs = tpool.execute(
+        raw_generate,
        text,
        max_length=koboldai_vars.genamt,
        do_streaming=True