Update default textgen presets
This commit is contained in:
parent
6167f50a89
commit
230e6cd142
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.68,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.17,
|
||||
"top_k": 77,
|
||||
"typical_p": 1,
|
||||
"top_a": 0.42,
|
||||
"tfs": 0.97,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.02,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.92,
|
||||
"top_k": 150,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"rep_pen": 4.5,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 3,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 2,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 10,
|
||||
"length_penalty": 1.4,
|
||||
"min_length": 200,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": true,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.87,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.99,
|
||||
"top_k": 85,
|
||||
"typical_p": 0.68,
|
||||
"top_a": 0,
|
||||
"tfs": 0.68,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 0.68,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.01,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 4,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0.6,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": false,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.5,
|
||||
"top_k": 40,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.2,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0,
|
||||
"temperature_last": true,
|
||||
"top_p": 0,
|
||||
"top_k": 1,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.18,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": false,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.31,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.14,
|
||||
"top_k": 49,
|
||||
"typical_p": 1,
|
||||
"top_a": 0.52,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 1.49,
|
||||
"eta_cutoff": 10.42,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.17,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.5,
|
||||
"top_k": 0,
|
||||
"typical_p": 0.19,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 0.19,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.66,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 0.6,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 0.6,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.1,
|
||||
"top_k": 40,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.18,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 200,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.98,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.37,
|
||||
"top_k": 100,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.18,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,24 +1,85 @@
|
|||
{
|
||||
"temp": 1.06,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 2,
|
||||
"mirostat_tau": 9.61,
|
||||
"mirostat_eta": 1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,24 +1,85 @@
|
|||
{
|
||||
"temp": 1.17,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 2,
|
||||
"mirostat_tau": 9.91,
|
||||
"mirostat_eta": 1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,24 +1,85 @@
|
|||
{
|
||||
"temp": 1.17,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 2,
|
||||
"mirostat_tau": 9.62,
|
||||
"mirostat_eta": 1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 2,
|
||||
"mirostat_tau": 8,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.85,
|
||||
"top_k": 50,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.8,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.9,
|
||||
"top_k": 100,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.99,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 100,
|
||||
"typical_p": 0.97,
|
||||
"rep_pen": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 0.97,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.63,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.98,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.05,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.99,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.85,
|
||||
"top_k": 12,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.07,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 100,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.05,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.44,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.99,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.18,
|
||||
"top_k": 30,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.72,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.73,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.53,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.64,
|
||||
"top_k": 33,
|
||||
"typical_p": 1,
|
||||
"top_a": 0.04,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.07,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.9,
|
||||
"top_k": 20,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.31,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.29,
|
||||
"top_k": 72,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.09,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.02,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.95,
|
||||
"top_k": 50,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.7,
|
||||
"temperature_last": true,
|
||||
"top_p": 1,
|
||||
"top_k": 0,
|
||||
"typical_p": 1,
|
||||
"top_a": 0.2,
|
||||
"tfs": 0.95,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.15,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 1.01,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.21,
|
||||
"top_k": 91,
|
||||
"typical_p": 1,
|
||||
"top_a": 0.75,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 10.78,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.21,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1.07,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -11,6 +11,8 @@
|
|||
"min_p": 0.1,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
|
@ -19,24 +21,56 @@
|
|||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"truncation_length": 2048,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"streaming": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"type": "ooba",
|
||||
"legacy_api": false,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
5,
|
||||
6,
|
||||
|
@ -46,5 +80,6 @@
|
|||
3,
|
||||
4
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -11,6 +11,8 @@
|
|||
"min_p": 0.1,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
|
@ -19,24 +21,56 @@
|
|||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"truncation_length": 2048,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"streaming": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"type": "ooba",
|
||||
"legacy_api": false,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
5,
|
||||
6,
|
||||
|
@ -46,5 +80,6 @@
|
|||
3,
|
||||
4
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -11,6 +11,8 @@
|
|||
"min_p": 0.1,
|
||||
"rep_pen": 1,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
|
@ -19,24 +21,56 @@
|
|||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"truncation_length": 2048,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"streaming": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"type": "ooba",
|
||||
"legacy_api": false,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
5,
|
||||
6,
|
||||
|
@ -46,5 +80,6 @@
|
|||
3,
|
||||
4
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.82,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.21,
|
||||
"top_k": 72,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.19,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
5,
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
2,
|
||||
3,
|
||||
4
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
|
@ -1,23 +1,85 @@
|
|||
{
|
||||
"temp": 0.65,
|
||||
"temperature_last": true,
|
||||
"top_p": 0.47,
|
||||
"top_k": 42,
|
||||
"typical_p": 1,
|
||||
"top_a": 0,
|
||||
"tfs": 1,
|
||||
"epsilon_cutoff": 0,
|
||||
"eta_cutoff": 0,
|
||||
"typical_p": 1,
|
||||
"min_p": 0,
|
||||
"rep_pen": 1.18,
|
||||
"rep_pen_range": 0,
|
||||
"rep_pen_decay": 0,
|
||||
"rep_pen_slope": 1,
|
||||
"no_repeat_ngram_size": 0,
|
||||
"penalty_alpha": 0,
|
||||
"num_beams": 1,
|
||||
"length_penalty": 1,
|
||||
"min_length": 0,
|
||||
"encoder_rep_pen": 1,
|
||||
"freq_pen": 0,
|
||||
"presence_pen": 0,
|
||||
"skew": 0,
|
||||
"do_sample": true,
|
||||
"early_stopping": false,
|
||||
"dynatemp": false,
|
||||
"min_temp": 0,
|
||||
"max_temp": 2,
|
||||
"dynatemp_exponent": 1,
|
||||
"smoothing_factor": 0,
|
||||
"smoothing_curve": 1,
|
||||
"dry_allowed_length": 2,
|
||||
"dry_multiplier": 0,
|
||||
"dry_base": 1.75,
|
||||
"dry_sequence_breakers": "[\"\\n\", \":\", \"\\\"\", \"*\"]",
|
||||
"dry_penalty_last_n": 0,
|
||||
"add_bos_token": true,
|
||||
"ban_eos_token": false,
|
||||
"skip_special_tokens": true,
|
||||
"mirostat_mode": 0,
|
||||
"mirostat_tau": 5,
|
||||
"mirostat_eta": 0.1
|
||||
"mirostat_eta": 0.1,
|
||||
"guidance_scale": 1,
|
||||
"negative_prompt": "",
|
||||
"grammar_string": "",
|
||||
"json_schema": {},
|
||||
"banned_tokens": "",
|
||||
"sampler_priority": [
|
||||
"temperature",
|
||||
"dynamic_temperature",
|
||||
"quadratic_sampling",
|
||||
"top_k",
|
||||
"top_p",
|
||||
"typical_p",
|
||||
"epsilon_cutoff",
|
||||
"eta_cutoff",
|
||||
"tfs",
|
||||
"top_a",
|
||||
"min_p",
|
||||
"mirostat"
|
||||
],
|
||||
"samplers": [
|
||||
"top_k",
|
||||
"tfs_z",
|
||||
"typical_p",
|
||||
"top_p",
|
||||
"min_p",
|
||||
"temperature"
|
||||
],
|
||||
"ignore_eos_token": false,
|
||||
"spaces_between_special_tokens": true,
|
||||
"speculative_ngram": false,
|
||||
"sampler_order": [
|
||||
6,
|
||||
0,
|
||||
1,
|
||||
3,
|
||||
4,
|
||||
2,
|
||||
5
|
||||
],
|
||||
"logit_bias": [],
|
||||
"rep_pen_size": 0
|
||||
}
|
||||
|
|
Loading…
Reference in New Issue