Specscheduler #90

chenzhuofu · 2025-01-10T16:10:07Z

Description of changes:

Related Issues:

Linked Issues:

Issue #

Issues closed by this PR:

Closes #

…cscheduler

Specscheduler request emission

…cscheduler-request-emission

…cscheduler

…quests

…cscheduler

Coutinuous batching schedulers

…-serve into paged_attention_new

…xflow-serve into paged_attention_new

chenzhuofu · 2025-01-31T15:10:58Z

Paged attention new

zikun-li and others added 30 commits September 7, 2024 17:48

Fix bug.

f4e46d2

fix: indeterminate output of customAllReduce

bacc515

Merge branch 'specscheduler' of github.com:flexflow/FlexFlow into spe…

101c420

…cscheduler

fix: request expected latency

3a35387

feat: add GenerationRequest

9b2245b

feat: add EmissionMachine to simulate requests arrival

2112b48

chore: minor

86e31c3

chore: minor

0997fad

feat: update load_pending_requests logic

ae0b8e3

fix: dead lock in request manager; client wait until server init

132f68f

feat: client support prompt input with slo_ratio

c57b3ee

feat: add an prompt processing script

2040cf7

style: minor format

03ba37e

feat: add slo attainment metric

36fb00e

chore: minor

fd6f610

feat: separate max_tokens_per_batch for SSM and LLM

6f89252

chore: remove redundant max_spec_tree_tokens

d67d577

chore: minor

1b5c66e

style: format

d19cd75

Merge pull request #1494 from flexflow/specscheduler-request-emission

6c20f18

Specscheduler request emission

chore: minor output

6e37125

Fix bugs in the scheduler.

3c4e50e

feat: add max_tokens_per_prefilling_batch

62ac7ed

feat: support batched prefilling

da91d84

Merge branch 'specscheduler' of github.com:flexflow/FlexFlow into spe…

d013079

…cscheduler-request-emission

style: format

1637ed4

Add a switch for early termination based on slo attainment.

bcb028c

Merge branch 'specscheduler' of github.com:flexflow/FlexFlow into spe…

020a210

…cscheduler

fix: memory misalignment

06d332c

Merge branch 'specscheduler' of github.com:flexflow/FlexFlow into spe…

cf7b7b9

…cscheduler

chenzhuofu and others added 28 commits November 29, 2024 09:36

feat: add pytorch GEMM

d09124c

chore: remove unused

115a3ff

feat: add absolute slo constraint

1a5803e

style: format

7e29665

feat: add seperate server baseline

afaa88f

fix: update tree depth

841bee1

feat: add a switch for fcfs baseline

b0a5918

feat: added data structures in request manager to handle preempted re…

4c1b2ce

…quests

fix: use num tokens to decode to replace spare latency

9fb8885

feat: support the policy fcfs and smallest time to attain

aa2d36d

chore: scheduling policy minor enhancement

04cf206

Merge branch 'specscheduler' of github.com:flexflow/FlexFlow into spe…

522473b

…cscheduler

Merge branch 'specscheduler' into coutinuous-batching-schedulers

847ec41

Merge pull request #1554 from flexflow/coutinuous-batching-schedulers

3e619d8

Coutinuous batching schedulers

chore: minor

76decb3

feat: add overhead breakdown

b920838

fix: overhead breakdown

17cbc9c

style: format

a21f9fb

:Merge branch 'specscheduler' of https://github.com/flexflow/flexflow…

bc67e97

…-serve into paged_attention_new

fix: minor

a5b7de6

feat: merge misc. from page_attention_new

76c23c0

fix: merge page_manager, also fix some issues

9c042f5

style: format code

2a751fd

fix: minor

3ed67e4

fix: merge page_manager, also fix some issues

69b9f72

style: format code

e0eca51

Merge branch 'paged_attention_new' of https://github.com/flexflow/fle…

0f13a92

…xflow-serve into paged_attention_new

chore: remove outdated comments

e2d6fc6

Merge pull request #82 from flexflow/paged_attention_new

918356d

Paged attention new

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Specscheduler #90

Specscheduler #90

Uh oh!

chenzhuofu commented Jan 10, 2025

Uh oh!

chenzhuofu commented Jan 31, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

7 participants

Specscheduler #90

Are you sure you want to change the base?

Specscheduler #90

Uh oh!

Conversation

chenzhuofu commented Jan 10, 2025

Uh oh!

chenzhuofu commented Jan 31, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

7 participants