Add vllm:request_max_num_generation_tokens metric #243

Closed

Assignees

Milestone

opened

on Oct 29, 2025

vllm:request_max_num_generation_tokens - This is the minimum of max-model-len - prompt length and max_tokens if defined.

Metadata

Assignees

mayabar

Labels

No labels

No labels

Type

No type

Projects

No projects

Milestone

Release v0.7.0No due date

Relationships

None yet

Development

No branches or pull requests