wip context viewer

2025-06-05 21:59:24 +02:00 · 2022-08-25 17:59:22 -05:00
parent b9af9a1669
commit 5052b39c3f
1 changed files with 43 additions and 0 deletions
--- a/aiserver.py
+++ b/aiserver.py
@@ -39,6 +39,8 @@ import traceback
 import inspect
 import warnings
 import multiprocessing
+from enum import Enum
+from dataclasses import dataclass
 from collections.abc import Iterable
 from collections import OrderedDict
 from typing import Any, Callable, TypeVar, Tuple, Union, Dict, Set, List, Optional, Type
@@ -3970,6 +3972,19 @@ def check_for_backend_compilation():
            break
    koboldai_vars.checking = False

+class ContextType(Enum):
+    SOFT_PROMPT = 1
+    STORY = 2
+    WORLD_INFO = 3
+    MEMORY = 4
+    HEADER = 5
+
+@dataclass
+class ContextChunk:
+    def __init__(self, value, context_type: ContextType) -> None:
+        self.value = value
+        self.context_type = context_type
+
 def actionsubmit(data, actionmode=0, force_submit=False, force_prompt_gen=False, disable_recentrng=False, no_generate=False):
    # Ignore new submissions if the AI is currently busy
    if(koboldai_vars.aibusy):
@@ -4226,14 +4241,18 @@ def apiactionsubmit(data, use_memory=False, use_world_info=False, use_story=Fals
        mem = koboldai_vars.memory + "\n"
    else:
        mem = koboldai_vars.memory
+
    if(use_authors_note and koboldai_vars.authornote != ""):
        anotetxt  = ("\n" + koboldai_vars.authornotetemplate + "\n").replace("<|>", koboldai_vars.authornote)
    else:
        anotetxt = ""
+
    MIN_STORY_TOKENS = 8
    story_tokens = []
    mem_tokens = []
    wi_tokens = []
+    context = []
+
    story_budget = lambda: koboldai_vars.max_length - koboldai_vars.sp_length - koboldai_vars.genamt - len(tokenizer._koboldai_header) - len(story_tokens) - len(mem_tokens) - len(wi_tokens)
    budget = lambda: story_budget() + MIN_STORY_TOKENS
    if budget() < 0:
@@ -4241,15 +4260,20 @@ def apiactionsubmit(data, use_memory=False, use_world_info=False, use_story=Fals
            "msg": f"Your Max Tokens setting is too low for your current soft prompt and tokenizer to handle. It needs to be at least {koboldai_vars.max_length - budget()}.",
            "type": "token_overflow",
        }}), mimetype="application/json", status=500))
+
    if use_memory:
        mem_tokens = tokenizer.encode(utils.encodenewlines(mem))[-budget():]
+
    if use_world_info:
        world_info, _ = checkworldinfo(data, force_use_txt=True, scan_story=use_story)
        wi_tokens = tokenizer.encode(utils.encodenewlines(world_info))[-budget():]
+
    if use_story:
        if koboldai_vars.useprompt:
            story_tokens = tokenizer.encode(utils.encodenewlines(koboldai_vars.prompt))[-budget():]
+
    story_tokens = tokenizer.encode(utils.encodenewlines(data))[-story_budget():] + story_tokens
+
    if use_story:
        for i, action in enumerate(reversed(koboldai_vars.actions.values())):
            if story_budget() <= 0:
@@ -4260,6 +4284,23 @@ def apiactionsubmit(data, use_memory=False, use_world_info=False, use_story=Fals
                story_tokens = tokenizer.encode(utils.encodenewlines(anotetxt))[-story_budget():] + story_tokens
        if not koboldai_vars.useprompt:
            story_tokens = tokenizer.encode(utils.encodenewlines(koboldai_vars.prompt))[-budget():] + story_tokens
+
+    # Context tracker
+    if koboldai_vars.sp:
+        context.append(ContextChunk(koboldai_vars.sp, ContextType.SOFT_PROMPT))
+
+    if tokenizer._koboldai_header:
+        context.append(ContextChunk(tokenizer._koboldai_header, ContextType.HEADER))
+    
+    if mem_tokens:
+        context.append(ContextChunk(mem_tokens, ContextType.MEMORY))
+
+    if wi_tokens:
+        context.append(ContextChunk(wi_tokens, ContextType.WORLD_INFO))
+
+    if story_tokens:
+        context.append(ContextChunk(story_tokens, ContextType.STORY))
+
    tokens = tokenizer._koboldai_header + mem_tokens + wi_tokens + story_tokens
    assert story_budget() >= 0
    minimum = len(tokens) + 1
@@ -4270,6 +4311,8 @@ def apiactionsubmit(data, use_memory=False, use_world_info=False, use_story=Fals
    elif(koboldai_vars.use_colab_tpu or koboldai_vars.model in ("TPUMeshTransformerGPTJ", "TPUMeshTransformerGPTNeoX")):
        genout = apiactionsubmit_tpumtjgenerate(tokens, minimum, maximum)

+    koboldai_vars.context = context
+    print(context)
    return genout

 #==================================================================#