Fix for multiple prompts when using token streaming and random prompt. Disabled token streaming when that happens

2025-06-05 21:59:24 +02:00 · 2022-09-01 10:00:43 -04:00
parent 08fac1157a
commit 22b9b5781e
2 changed files with 22 additions and 18 deletions
--- a/aiserver.py
+++ b/aiserver.py
@@ -1828,7 +1828,7 @@ def patch_transformers():
                #koboldai_vars.actions.stream_token(tokenizer_text, batch=batch)
               
            if koboldai_vars.output_streaming:
-                koboldai_vars.actions.stream_tokens([utils.decodenewlines(tokenizer.decode(x[-1])) for x in input_ids], koboldai_vars.genamt)
+                koboldai_vars.actions.stream_tokens([utils.decodenewlines(tokenizer.decode(x[-1])) for x in input_ids])
            #if len(input_ids) > 1:
            #    koboldai_vars.actions.clear_unused_options()
            #    koboldai_vars.actions.append_options([utils.decodenewlines(tokenizer.decode(x[-1])) for x in input_ids])
@@ -3743,7 +3743,7 @@ def get_message(msg):
            f.write(str(msg['gpu_layers']) + '\n' + str(msg['disk_layers']))
            f.close()
        koboldai_vars.colaburl = msg['url'] + "/request"
-        vars.model = vars.model_selected
+        koboldai_vars.model = koboldai_vars.model_selected
        load_model(use_gpu=msg['use_gpu'], gpu_layers=msg['gpu_layers'], disk_layers=msg['disk_layers'], online_model=msg['online_model'])
    elif(msg['cmd'] == 'show_model'):
        print("Model Name: {}".format(getmodelname()))