Merge pull request #1854 from deciare/llamacpp-probs

Request and display token probabilities from llama.cpp backend
2025-06-05 21:59:27 +02:00 · 2024-02-24 15:06:28 +02:00
parent dab9bbb514 eaadfea639
commit 13aebc623a
3 changed files with 30 additions and 8 deletions
--- a/public/scripts/textgen-settings.js
+++ b/public/scripts/textgen-settings.js
@@ -755,7 +755,7 @@ async function generateTextGenWithStreaming(generate_data, signal) {
            } else {
                const newText = data?.choices?.[0]?.text || data?.content || '';
                text += newText;
-                logprobs = parseTextgenLogprobs(newText, data.choices?.[0]?.logprobs);
+                logprobs = parseTextgenLogprobs(newText, data.choices?.[0]?.logprobs || data?.completion_probabilities);
            }

            yield { text, swipes, logprobs };
@@ -771,7 +771,7 @@ async function generateTextGenWithStreaming(generate_data, signal) {
 * @param {Object} logprobs - logprobs object returned from the API
 * @returns {import('logprobs.js').TokenLogprobs | null} - converted logprobs
 */
-function parseTextgenLogprobs(token, logprobs) {
+export function parseTextgenLogprobs(token, logprobs) {
    if (!logprobs) {
        return null;
    }
@@ -788,6 +788,14 @@ function parseTextgenLogprobs(token, logprobs) {
            const candidates = Object.entries(topLogprobs[0]);
            return { token, topLogprobs: candidates };
        }
+        case LLAMACPP: {
+            /** @type {Record<string, number>[]} */
+            if (!logprobs?.length) {
+                return null;
+            }
+            const candidates = logprobs[0].probs.map(x => [ x.tok_str, x.prob ]);
+            return { token, topLogprobs: candidates };
+        }
        default:
            return null;
    }
@@ -933,6 +941,7 @@ export function getTextGenGenerationData(finalPrompt, maxTokens, isImpersonate,
        'n_predict': maxTokens,
        'mirostat': settings.mirostat_mode,
        'ignore_eos': settings.ban_eos_token,
+        'n_probs': power_user.request_token_probabilities ? 10 : undefined,
    };
    const aphroditeParams = {
        'n': canMultiSwipe ? settings.n : 1,