Update default textgen presets
This commit is contained in:
parent
6167f50a89
commit
230e6cd142
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.68,
|
"temp": 1.68,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.17,
|
"top_p": 0.17,
|
||||||
"top_k": 77,
|
"top_k": 77,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0.42,
|
"top_a": 0.42,
|
||||||
"tfs": 0.97,
|
"tfs": 0.97,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.02,
|
"rep_pen": 1.02,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.92,
|
"top_p": 0.92,
|
||||||
"top_k": 150,
|
"top_k": 150,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
"rep_pen": 4.5,
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
|
"rep_pen": 3,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 2,
|
"no_repeat_ngram_size": 2,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 10,
|
"num_beams": 10,
|
||||||
"length_penalty": 1.4,
|
"length_penalty": 1.4,
|
||||||
"min_length": 200,
|
"min_length": 200,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": true,
|
"early_stopping": true,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.87,
|
"temp": 0.87,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.99,
|
"top_p": 0.99,
|
||||||
"top_k": 85,
|
"top_k": 85,
|
||||||
"typical_p": 0.68,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 0.68,
|
"tfs": 0.68,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 0.68,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.01,
|
"rep_pen": 1.01,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1,
|
"temp": 1,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 4,
|
"top_k": 4,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0.6,
|
"penalty_alpha": 0.6,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": false,
|
"do_sample": false,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.5,
|
"top_p": 0.5,
|
||||||
"top_k": 40,
|
"top_k": 40,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.2,
|
"rep_pen": 1.2,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0,
|
"temp": 0,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0,
|
"top_p": 0,
|
||||||
"top_k": 1,
|
"top_k": 1,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.18,
|
"rep_pen": 1.18,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": false,
|
"do_sample": false,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.31,
|
"temp": 1.31,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.14,
|
"top_p": 0.14,
|
||||||
"top_k": 49,
|
"top_k": 49,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0.52,
|
"top_a": 0.52,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 1.49,
|
"epsilon_cutoff": 1.49,
|
||||||
"eta_cutoff": 10.42,
|
"eta_cutoff": 10.42,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.17,
|
"rep_pen": 1.17,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.5,
|
"top_p": 0.5,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 0.19,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 0.19,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.1,
|
"rep_pen": 1.1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.66,
|
"temp": 0.66,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 0.6,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 0.6,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.1,
|
"rep_pen": 1.1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.1,
|
"top_p": 0.1,
|
||||||
"top_k": 40,
|
"top_k": 40,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.18,
|
"rep_pen": 1.18,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 200,
|
"min_length": 200,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.98,
|
"temp": 0.98,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.37,
|
"top_p": 0.37,
|
||||||
"top_k": 100,
|
"top_k": 100,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.18,
|
"rep_pen": 1.18,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,24 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.06,
|
"temp": 1.06,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 2,
|
"mirostat_mode": 2,
|
||||||
"mirostat_tau": 9.61,
|
"mirostat_tau": 9.61,
|
||||||
"mirostat_eta": 1,
|
"mirostat_eta": 1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,24 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.17,
|
"temp": 1.17,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 2,
|
"mirostat_mode": 2,
|
||||||
"mirostat_tau": 9.91,
|
"mirostat_tau": 9.91,
|
||||||
"mirostat_eta": 1,
|
"mirostat_eta": 1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,24 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.17,
|
"temp": 1.17,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 2,
|
"mirostat_mode": 2,
|
||||||
"mirostat_tau": 9.62,
|
"mirostat_tau": 9.62,
|
||||||
"mirostat_eta": 1,
|
"mirostat_eta": 1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1,
|
"temp": 1,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 2,
|
"mirostat_mode": 2,
|
||||||
"mirostat_tau": 8,
|
"mirostat_tau": 8,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.85,
|
"top_p": 0.85,
|
||||||
"top_k": 50,
|
"top_k": 50,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.8,
|
"temp": 0.8,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.9,
|
"top_p": 0.9,
|
||||||
"top_k": 100,
|
"top_k": 100,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.99,
|
"temp": 1.99,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 100,
|
"top_k": 100,
|
||||||
"typical_p": 0.97,
|
|
||||||
"rep_pen": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 0.97,
|
||||||
|
"min_p": 0,
|
||||||
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.63,
|
"temp": 0.63,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.98,
|
"top_p": 0.98,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.05,
|
"rep_pen": 1.05,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.99,
|
"temp": 1.99,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.85,
|
"top_p": 0.85,
|
||||||
"top_k": 12,
|
"top_k": 12,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.07,
|
"temp": 1.07,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 100,
|
"top_k": 100,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.05,
|
"rep_pen": 1.05,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.44,
|
"temp": 0.44,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.99,
|
"temp": 1.99,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.18,
|
"top_p": 0.18,
|
||||||
"top_k": 30,
|
"top_k": 30,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.72,
|
"temp": 0.72,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.73,
|
"top_p": 0.73,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.1,
|
"rep_pen": 1.1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.53,
|
"temp": 1.53,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.64,
|
"top_p": 0.64,
|
||||||
"top_k": 33,
|
"top_k": 33,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0.04,
|
"top_a": 0.04,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.07,
|
"rep_pen": 1.07,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.9,
|
"top_p": 0.9,
|
||||||
"top_k": 20,
|
"top_k": 20,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.31,
|
"temp": 1.31,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.29,
|
"top_p": 0.29,
|
||||||
"top_k": 72,
|
"top_k": 72,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.09,
|
"rep_pen": 1.09,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.02,
|
"temp": 0.02,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.95,
|
"top_p": 0.95,
|
||||||
"top_k": 50,
|
"top_k": 50,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.7,
|
"temp": 0.7,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 1,
|
"top_p": 1,
|
||||||
"top_k": 0,
|
"top_k": 0,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0.2,
|
"top_a": 0.2,
|
||||||
"tfs": 0.95,
|
"tfs": 0.95,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.15,
|
"rep_pen": 1.15,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 1.01,
|
"temp": 1.01,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.21,
|
"top_p": 0.21,
|
||||||
"top_k": 91,
|
"top_k": 91,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0.75,
|
"top_a": 0.75,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 10.78,
|
"eta_cutoff": 10.78,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.21,
|
"rep_pen": 1.21,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1.07,
|
"encoder_rep_pen": 1.07,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -11,6 +11,8 @@
|
||||||
"min_p": 0.1,
|
"min_p": 0.1,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
|
@ -19,24 +21,56 @@
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
"freq_pen": 0,
|
"freq_pen": 0,
|
||||||
"presence_pen": 0,
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
"add_bos_token": true,
|
"add_bos_token": true,
|
||||||
"truncation_length": 2048,
|
|
||||||
"ban_eos_token": false,
|
"ban_eos_token": false,
|
||||||
"skip_special_tokens": true,
|
"skip_special_tokens": true,
|
||||||
"streaming": true,
|
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1,
|
"mirostat_eta": 0.1,
|
||||||
"guidance_scale": 1,
|
"guidance_scale": 1,
|
||||||
"negative_prompt": "",
|
"negative_prompt": "",
|
||||||
"grammar_string": "",
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
"banned_tokens": "",
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
"ignore_eos_token": false,
|
"ignore_eos_token": false,
|
||||||
"spaces_between_special_tokens": true,
|
"spaces_between_special_tokens": true,
|
||||||
"type": "ooba",
|
"speculative_ngram": false,
|
||||||
"legacy_api": false,
|
|
||||||
"sampler_order": [
|
"sampler_order": [
|
||||||
5,
|
5,
|
||||||
6,
|
6,
|
||||||
|
@ -46,5 +80,6 @@
|
||||||
3,
|
3,
|
||||||
4
|
4
|
||||||
],
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -11,6 +11,8 @@
|
||||||
"min_p": 0.1,
|
"min_p": 0.1,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
|
@ -19,24 +21,56 @@
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
"freq_pen": 0,
|
"freq_pen": 0,
|
||||||
"presence_pen": 0,
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
"add_bos_token": true,
|
"add_bos_token": true,
|
||||||
"truncation_length": 2048,
|
|
||||||
"ban_eos_token": false,
|
"ban_eos_token": false,
|
||||||
"skip_special_tokens": true,
|
"skip_special_tokens": true,
|
||||||
"streaming": true,
|
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1,
|
"mirostat_eta": 0.1,
|
||||||
"guidance_scale": 1,
|
"guidance_scale": 1,
|
||||||
"negative_prompt": "",
|
"negative_prompt": "",
|
||||||
"grammar_string": "",
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
"banned_tokens": "",
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
"ignore_eos_token": false,
|
"ignore_eos_token": false,
|
||||||
"spaces_between_special_tokens": true,
|
"spaces_between_special_tokens": true,
|
||||||
"type": "ooba",
|
"speculative_ngram": false,
|
||||||
"legacy_api": false,
|
|
||||||
"sampler_order": [
|
"sampler_order": [
|
||||||
5,
|
5,
|
||||||
6,
|
6,
|
||||||
|
@ -46,5 +80,6 @@
|
||||||
3,
|
3,
|
||||||
4
|
4
|
||||||
],
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -11,6 +11,8 @@
|
||||||
"min_p": 0.1,
|
"min_p": 0.1,
|
||||||
"rep_pen": 1,
|
"rep_pen": 1,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
|
@ -19,24 +21,56 @@
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
"freq_pen": 0,
|
"freq_pen": 0,
|
||||||
"presence_pen": 0,
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
"add_bos_token": true,
|
"add_bos_token": true,
|
||||||
"truncation_length": 2048,
|
|
||||||
"ban_eos_token": false,
|
"ban_eos_token": false,
|
||||||
"skip_special_tokens": true,
|
"skip_special_tokens": true,
|
||||||
"streaming": true,
|
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1,
|
"mirostat_eta": 0.1,
|
||||||
"guidance_scale": 1,
|
"guidance_scale": 1,
|
||||||
"negative_prompt": "",
|
"negative_prompt": "",
|
||||||
"grammar_string": "",
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
"banned_tokens": "",
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
"ignore_eos_token": false,
|
"ignore_eos_token": false,
|
||||||
"spaces_between_special_tokens": true,
|
"spaces_between_special_tokens": true,
|
||||||
"type": "ooba",
|
"speculative_ngram": false,
|
||||||
"legacy_api": false,
|
|
||||||
"sampler_order": [
|
"sampler_order": [
|
||||||
5,
|
5,
|
||||||
6,
|
6,
|
||||||
|
@ -46,5 +80,6 @@
|
||||||
3,
|
3,
|
||||||
4
|
4
|
||||||
],
|
],
|
||||||
|
"logit_bias": [],
|
||||||
"rep_pen_size": 0
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.82,
|
"temp": 0.82,
|
||||||
|
"temperature_last": true,
|
||||||
"top_p": 0.21,
|
"top_p": 0.21,
|
||||||
"top_k": 72,
|
"top_k": 72,
|
||||||
"typical_p": 1,
|
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
|
"typical_p": 1,
|
||||||
|
"min_p": 0,
|
||||||
"rep_pen": 1.19,
|
"rep_pen": 1.19,
|
||||||
"rep_pen_range": 0,
|
"rep_pen_range": 0,
|
||||||
|
"rep_pen_decay": 0,
|
||||||
|
"rep_pen_slope": 1,
|
||||||
"no_repeat_ngram_size": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"penalty_alpha": 0,
|
"penalty_alpha": 0,
|
||||||
"num_beams": 1,
|
"num_beams": 1,
|
||||||
"length_penalty": 1,
|
"length_penalty": 1,
|
||||||
"min_length": 0,
|
"min_length": 0,
|
||||||
"encoder_rep_pen": 1,
|
"encoder_rep_pen": 1,
|
||||||
|
"freq_pen": 0,
|
||||||
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
"do_sample": true,
|
"do_sample": true,
|
||||||
"early_stopping": false,
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
"mirostat_mode": 0,
|
"mirostat_mode": 0,
|
||||||
"mirostat_tau": 5,
|
"mirostat_tau": 5,
|
||||||
"mirostat_eta": 0.1
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
5,
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
2,
|
||||||
|
3,
|
||||||
|
4
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,23 +1,85 @@
|
||||||
{
|
{
|
||||||
"temp": 0.65,
|
"temp": 0.65,
|
||||||
"top_p": 0.47,
|
"temperature_last": true,
|
||||||
"top_k": 42,
|
"top_p": 0.47,
|
||||||
"typical_p": 1,
|
"top_k": 42,
|
||||||
"top_a": 0,
|
"top_a": 0,
|
||||||
"tfs": 1,
|
"tfs": 1,
|
||||||
"epsilon_cutoff": 0,
|
"epsilon_cutoff": 0,
|
||||||
"eta_cutoff": 0,
|
"eta_cutoff": 0,
|
||||||
"rep_pen": 1.18,
|
"typical_p": 1,
|
||||||
"rep_pen_range": 0,
|
"min_p": 0,
|
||||||
"no_repeat_ngram_size": 0,
|
"rep_pen": 1.18,
|
||||||
"penalty_alpha": 0,
|
"rep_pen_range": 0,
|
||||||
"num_beams": 1,
|
"rep_pen_decay": 0,
|
||||||
"length_penalty": 1,
|
"rep_pen_slope": 1,
|
||||||
"min_length": 0,
|
"no_repeat_ngram_size": 0,
|
||||||
"encoder_rep_pen": 1,
|
"penalty_alpha": 0,
|
||||||
"do_sample": true,
|
"num_beams": 1,
|
||||||
"early_stopping": false,
|
"length_penalty": 1,
|
||||||
"mirostat_mode": 0,
|
"min_length": 0,
|
||||||
"mirostat_tau": 5,
|
"encoder_rep_pen": 1,
|
||||||
"mirostat_eta": 0.1
|
"freq_pen": 0,
|
||||||
}
|
"presence_pen": 0,
|
||||||
|
"skew": 0,
|
||||||
|
"do_sample": true,
|
||||||
|
"early_stopping": false,
|
||||||
|
"dynatemp": false,
|
||||||
|
"min_temp": 0,
|
||||||
|
"max_temp": 2,
|
||||||
|
"dynatemp_exponent": 1,
|
||||||
|
"smoothing_factor": 0,
|
||||||
|
"smoothing_curve": 1,
|
||||||
|
"dry_allowed_length": 2,
|
||||||
|
"dry_multiplier": 0,
|
||||||
|
"dry_base": 1.75,
|
||||||
|
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||||
|
"dry_penalty_last_n": 0,
|
||||||
|
"add_bos_token": true,
|
||||||
|
"ban_eos_token": false,
|
||||||
|
"skip_special_tokens": true,
|
||||||
|
"mirostat_mode": 0,
|
||||||
|
"mirostat_tau": 5,
|
||||||
|
"mirostat_eta": 0.1,
|
||||||
|
"guidance_scale": 1,
|
||||||
|
"negative_prompt": "",
|
||||||
|
"grammar_string": "",
|
||||||
|
"json_schema": {},
|
||||||
|
"banned_tokens": "",
|
||||||
|
"sampler_priority": [
|
||||||
|
"temperature",
|
||||||
|
"dynamic_temperature",
|
||||||
|
"quadratic_sampling",
|
||||||
|
"top_k",
|
||||||
|
"top_p",
|
||||||
|
"typical_p",
|
||||||
|
"epsilon_cutoff",
|
||||||
|
"eta_cutoff",
|
||||||
|
"tfs",
|
||||||
|
"top_a",
|
||||||
|
"min_p",
|
||||||
|
"mirostat"
|
||||||
|
],
|
||||||
|
"samplers": [
|
||||||
|
"top_k",
|
||||||
|
"tfs_z",
|
||||||
|
"typical_p",
|
||||||
|
"top_p",
|
||||||
|
"min_p",
|
||||||
|
"temperature"
|
||||||
|
],
|
||||||
|
"ignore_eos_token": false,
|
||||||
|
"spaces_between_special_tokens": true,
|
||||||
|
"speculative_ngram": false,
|
||||||
|
"sampler_order": [
|
||||||
|
6,
|
||||||
|
0,
|
||||||
|
1,
|
||||||
|
3,
|
||||||
|
4,
|
||||||
|
2,
|
||||||
|
5
|
||||||
|
],
|
||||||
|
"logit_bias": [],
|
||||||
|
"rep_pen_size": 0
|
||||||
|
}
|
||||||
|
|
Loading…
Reference in New Issue