Параметры

Параметры выборки формируют процесс генерации токенов модели. Вы можете отправить любые параметры из следующего списка, а также другие, в AITUNNEL.

Temperature

Ключ: temperature
Опционально, float, от 0.0 до 2.0
По умолчанию: 1.0

Этот параметр влияет на разнообразие ответов модели. Более низкие значения приводят к более предсказуемым и типичным ответам, в то время как более высокие значения поощряют более разнообразные и менее распространенные ответы. При значении 0 модель всегда дает один и тот же ответ для данного входного запроса.

Top P

Ключ: top_p
Опционально, float, от 0.0 до 1.0
По умолчанию: 1.0

Этот параметр ограничивает выбор модели процентом вероятных токенов: только топ токены, чьи вероятности в сумме дают P. Более низкое значение делает ответы модели более предсказуемыми, в то время как настройка по умолчанию позволяет использовать полный диапазон выбора токенов. Думайте об этом как о динамическом Top-K.

Top K

Ключ: top_k
Опционально, integer, 0 или выше
По умолчанию: 0

Это ограничивает выбор токенов моделью на каждом шаге, заставляя ее выбирать из меньшего набора. Значение 1 означает, что модель всегда будет выбирать наиболее вероятный следующий токен, что приводит к предсказуемым результатам. По умолчанию эта настройка отключена, позволяя модели рассматривать все варианты.

Frequency Penalty

Ключ: frequency_penalty
Опционально, float, от -2.0 до 2.0
По умолчанию: 0.0

Этот параметр направлен на контроль повторения токенов на основе того, как часто они появляются во входных данных. Он пытается реже использовать те токены, которые чаще появляются во входных данных, пропорционально частоте их появления. Штраф токена масштабируется с количеством появлений. Отрицательные значения будут поощрять повторное использование токенов.

Presence Penalty

Ключ: presence_penalty
Опционально, float, от -2.0 до 2.0
По умолчанию: 0.0

Регулирует, как часто модель повторяет определенные токены, уже использованные во входных данных. Более высокие значения делают такое повторение менее вероятным, в то время как отрицательные значения делают обратное. Штраф токена не масштабируется с количеством появлений. Отрицательные значения будут поощрять повторное использование токенов.

Repetition Penalty

Ключ: repetition_penalty
Опционально, float, от 0.0 до 2.0
По умолчанию: 1.0

Помогает уменьшить повторение токенов из входных данных. Более высокое значение делает модель менее склонной к повторению токенов, но слишком высокое значение может сделать вывод менее связным (часто с длинными предложениями, в которых отсутствуют маленькие слова). Штраф токена масштабируется на основе вероятности исходного токена.

Min P

Ключ: min_p
Опционально, float, от 0.0 до 1.0
По умолчанию: 0.0

Представляет минимальную вероятность для токена, чтобы он был рассмотрен, относительно вероятности наиболее вероятного токена. (Значение меняется в зависимости от уровня уверенности наиболее вероятного токена.) Если ваш Min-P установлен на 0.1, это означает, что он будет допускать только токены, которые как минимум в 1/10 раз вероятнее, чем лучший возможный вариант.

Top A

Ключ: top_a
Опционально, float, от 0.0 до 1.0
По умолчанию: 0.0

Рассматривает только топ токены с "достаточно высокой" вероятностью на основе вероятности наиболее вероятного токена. Думайте об этом как о динамическом Top-P. Более низкое значение Top-A фокусирует выбор на основе токена с наивысшей вероятностью, но с более узким охватом. Более высокое значение Top-A не обязательно влияет на креативность вывода, а скорее уточняет процесс фильтрации на основе максимальной вероятности.

Seed

Ключ: seed
Опционально, integer

Если указан, вывод будет детерминированным, так что повторные запросы с тем же seed и параметрами должны возвращать тот же результат. Детерминированность не гарантируется для некоторых моделей.

Max Tokens

Ключ: max_tokens
Опционально, integer, 1 или выше

Устанавливает верхний предел для количества токенов, которые модель может сгенерировать в ответе. Она не произведет больше этого лимита. Максимальное значение - это длина контекста минус длина промпта.

Logit Bias

Ключ: logit_bias
Опционально, map

Принимает JSON-объект, который сопоставляет токены (указанные их ID токена в токенизаторе) с соответствующим значением смещения от -100 до 100. Математически, смещение добавляется к логитам, сгенерированным моделью перед выборкой. Точный эффект будет варьироваться в зависимости от модели, но значения между -1 и 1 должны уменьшить или увеличить вероятность выбора; значения типа -100 или 100 должны привести к запрету или исключительному выбору соответствующего токена.

Logprobs

Ключ: logprobs
Опционально, boolean

Возвращать ли логарифмические вероятности выходных токенов или нет. Если true, возвращает логарифмические вероятности каждого возвращенного выходного токена.

Top Logprobs

Ключ: top_logprobs
Опционально, integer

Целое число от 0 до 20, указывающее количество наиболее вероятных токенов для возврата на каждой позиции токена, каждый с соответствующей логарифмической вероятностью. logprobs должен быть установлен в true, если используется этот параметр.

Response Format

Ключ: response_format
Опционально, map

Заставляет модель производить определенный формат вывода. Установка { "type": "json_object" } включает режим JSON, который гарантирует, что сообщение, генерируемое моделью, является действительным JSON.

Примечание

При использовании режима JSON вы также должны сами проинструктировать модель производить JSON через системное или пользовательское сообщение.

Structured Outputs

Ключ: structured_outputs
Опционально, boolean

Если модель может возвращать структурированные выходные данные, используя response_format json_schema.

Stop

Ключ: stop
Опционально, array

Немедленно остановить генерацию, если модель встретит любой токен, указанный в массиве stop.

Tools

Ключ: tools
Опционально, array

Параметр вызова инструментов, следующий форме запроса вызова инструментов OpenAI. Для непровайдеров OpenAI он будет преобразован соответствующим образом. Нажмите здесь, чтобы узнать больше о вызове инструментов

Tool Choice

Ключ: tool_choice
Опционально, array

Контролирует, какой (если есть) инструмент будет вызван моделью. 'none' означает, что модель не будет вызывать никакой инструмент и вместо этого сгенерирует сообщение. 'auto' означает, что модель может выбрать между генерацией сообщения или вызовом одного или нескольких инструментов. 'required' означает, что модель должна вызвать один или несколько инструментов. Указание конкретного инструмента через {"type": "function", "function": {"name": "my_function"}} заставляет модель вызвать этот инструмент.

Параметры ​

Temperature ​

Top P ​

Top K ​

Frequency Penalty ​

Presence Penalty ​

Repetition Penalty ​

Min P ​

Top A ​

Seed ​

Max Tokens ​

Logit Bias ​

Logprobs ​

Top Logprobs ​

Response Format ​

Structured Outputs ​

Stop ​

Tools ​

Tool Choice ​