add tracer in v1 to log generator perf metrics by JenniferWang · Pull Request #720 · meta-pytorch/torchforge

JenniferWang · 2026-01-21T02:40:27Z

Summary:

tl;dr

Add tracer in v1 to log perf metrics to wandb

V0 vs V1 Metrics Parity Comparison

Category	v0 Metric	v1 Metric	Parity
Generate - Request Count	`generator/generate/count_requests` (SUM)	`generator/generate/count_requests` (SUM)	✅ Same
Generate - Completion Count	`generator/generate/count_sequences_completed` (SUM)	`generator/generate/count_sequences_completed` (SUM)	✅ Same
Generate - E2E Timing	`generator_perf/generate/*` (Tracer, GPU)	`generator_perf/generate/*` (Tracer, GPU)	✅ Same
Update - Pending Requests	`generator_perf/update_weights/sum_pending_gen_requests` (SUM)	N/A - AsyncLLM handles internally	⚠️ Skip (by design)
Update - Wait for Generation	`generator_perf/update_weights/avg_waiting_for_generation_duration_s` (MEAN)	`generator_perf/update_weights/pause_generation_duration_s` (MEAN)	✅ Equivalent - renamed for clarity
Update - Fetch Weights	`generator_perf/update_weights/wait_fetch_weights` (MEAN)	`generator_perf/update_weights/worker_load_weights_duration_s` (MEAN)	✅ Equivalent - renamed for clarity
Worker - Update Timing	`generator_perf/update_weights/generator_worker_update/*` (trace, GPU)	`generator_perf/update_weights/generator_worker_update/*` (trace, GPU)	✅ Same

Test Plan

Main GRPO app: python -m apps.grpo.main --config apps/grpo/qwen3_1_7b.yaml

wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run drawn-waterfall-686
wandb: ⭐️ View project at https://meta.wandb.io/jiyue/grpo-training
wandb: 🚀 View run at https://meta.wandb.io/jiyue/grpo-training/runs/6pltx38p
wandb: Detected [openai] in use.
....
rvability.metric_actors.GlobalLoggingActor global_logger>] === [global_reduce] - METRICS STEP 1 ===
  ...
  generator/generate/count_requests: 13.0
  generator/generate/count_sequences_completed: 96.0
  generator_perf/generate/total_duration_avg_s: 3.6518315022786463
  generator_perf/generate/total_duration_max_s: 9.2080615234375
  generator_perf/update_weights/pause_generation_duration_s: 2.8634108749683946
  generator_perf/update_weights/resume_generation_duration_s: 1.918897032737732e-05
  generator_perf/update_weights/worker_load_weights_duration_s: 3.506648204056546
  ...

Make sure integration tests that do not initialize the tracer still works
pytest tests/integration_tests/test_generator_lifecycle.py -v -s

Next Steps

[ ] implement the prefetch logic & shared memory
[-] Add metric similar to generator v0
[ ] Perf/Throughput testing compared to generator v0

Differential Revision: D91038187

meta-codesync · 2026-01-21T02:40:33Z

@JenniferWang has exported this pull request. If you are a Meta employee, you can view the originating Diff in D91038187.

Summary: ## tl;dr Add tracer in v1 to log perf metrics to wandb ## V0 vs V1 Metrics Parity Comparison | Category | v0 Metric | v1 Metric | Parity | |----------|-----------|-----------|--------| | **Generate - Request Count** | `generator/generate/count_requests` (SUM) | `generator/generate/count_requests` (SUM) | ✅ Same | | **Generate - Completion Count** | `generator/generate/count_sequences_completed` (SUM) | `generator/generate/count_sequences_completed` (SUM) | ✅ Same | | **Generate - E2E Timing** | `generator_perf/generate/*` (Tracer, GPU) | `generator_perf/generate/*` (Tracer, GPU) | ✅ Same | | **Update - Pending Requests** | `generator_perf/update_weights/sum_pending_gen_requests` (SUM) | N/A - AsyncLLM handles internally | ⚠️ Skip (by design) | | **Update - Wait for Generation** | `generator_perf/update_weights/avg_waiting_for_generation_duration_s` (MEAN) | `generator_perf/update_weights/pause_generation_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Update - Fetch Weights** | `generator_perf/update_weights/wait_fetch_weights` (MEAN) | `generator_perf/update_weights/worker_load_weights_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Worker - Update Timing** | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | ✅ Same | ## Test Plan Main GRPO app: `python -m apps.grpo.main --config apps/grpo/qwen3_1_7b.yaml` ``` wandb: Run `wandb offline` to turn off syncing. wandb: Syncing run drawn-waterfall-686 wandb: ⭐️ View project at https://meta.wandb.io/jiyue/grpo-training wandb: 🚀 View run at https://meta.wandb.io/jiyue/grpo-training/runs/6pltx38p wandb: Detected [openai] in use. .... rvability.metric_actors.GlobalLoggingActor global_logger>] === [global_reduce] - METRICS STEP 1 === ... generator/generate/count_requests: 13.0 generator/generate/count_sequences_completed: 96.0 generator_perf/generate/total_duration_avg_s: 3.6518315022786463 generator_perf/generate/total_duration_max_s: 9.2080615234375 generator_perf/update_weights/pause_generation_duration_s: 2.8634108749683946 generator_perf/update_weights/resume_generation_duration_s: 1.918897032737732e-05 generator_perf/update_weights/worker_load_weights_duration_s: 3.506648204056546 ... ``` Make sure integration tests that do not initialize the tracer still works `pytest tests/integration_tests/test_generator_lifecycle.py -v -s` ## Next Steps [ ] implement the prefetch logic & shared memory [-] Add metric similar to generator v0 [ ] Perf/Throughput testing compared to generator v0 Differential Revision: D91038187

allenwang28

Review automatically exported from Phabricator review in Meta.

Summary: ## tl;dr Add tracer in v1 to log perf metrics to wandb ## V0 vs V1 Metrics Parity Comparison | Category | v0 Metric | v1 Metric | Parity | |----------|-----------|-----------|--------| | **Generate - Request Count** | `generator/generate/count_requests` (SUM) | `generator/generate/count_requests` (SUM) | ✅ Same | | **Generate - Completion Count** | `generator/generate/count_sequences_completed` (SUM) | `generator/generate/count_sequences_completed` (SUM) | ✅ Same | | **Generate - E2E Timing** | `generator_perf/generate/*` (Tracer, GPU) | `generator_perf/generate/*` (Tracer, GPU) | ✅ Same | | **Update - Pending Requests** | `generator_perf/update_weights/sum_pending_gen_requests` (SUM) | N/A - AsyncLLM handles internally | ⚠️ Skip (by design) | | **Update - Wait for Generation** | `generator_perf/update_weights/avg_waiting_for_generation_duration_s` (MEAN) | `generator_perf/update_weights/pause_generation_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Update - Fetch Weights** | `generator_perf/update_weights/wait_fetch_weights` (MEAN) | `generator_perf/update_weights/worker_load_weights_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Worker - Update Timing** | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | ✅ Same | ## Test Plan Main GRPO app: `python -m apps.grpo.main --config apps/grpo/qwen3_1_7b.yaml` ``` wandb: Run `wandb offline` to turn off syncing. wandb: Syncing run drawn-waterfall-686 wandb: ⭐️ View project at https://meta.wandb.io/jiyue/grpo-training wandb: 🚀 View run at https://meta.wandb.io/jiyue/grpo-training/runs/6pltx38p wandb: Detected [openai] in use. .... rvability.metric_actors.GlobalLoggingActor global_logger>] === [global_reduce] - METRICS STEP 1 === ... generator/generate/count_requests: 13.0 generator/generate/count_sequences_completed: 96.0 generator_perf/generate/total_duration_avg_s: 3.6518315022786463 generator_perf/generate/total_duration_max_s: 9.2080615234375 generator_perf/update_weights/pause_generation_duration_s: 2.8634108749683946 generator_perf/update_weights/resume_generation_duration_s: 1.918897032737732e-05 generator_perf/update_weights/worker_load_weights_duration_s: 3.506648204056546 ... ``` Make sure integration tests that do not initialize the tracer still works `pytest tests/integration_tests/test_generator_lifecycle.py -v -s` ## Next Steps [ ] implement the prefetch logic & shared memory [-] Add metric similar to generator v0 [ ] Perf/Throughput testing compared to generator v0 Reviewed By: allenwang28 Differential Revision: D91038187

codecov-commenter · 2026-01-26T16:52:16Z

Codecov Report

✅ All modified and coverable lines are covered by tests.
✅ Project coverage is 71.40%. Comparing base (080770c) to head (dc35fed).
⚠️ Report is 14 commits behind head on main.

Additional details and impacted files

@@            Coverage Diff             @@
##             main     #720      +/-   ##
==========================================
- Coverage   78.33%   71.40%   -6.93%     
==========================================
  Files          36       41       +5     
  Lines        4209     4288      +79     
==========================================
- Hits         3297     3062     -235     
- Misses        912     1226     +314

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

Summary: ## tl;dr Add tracer in v1 to log perf metrics to wandb ## V0 vs V1 Metrics Parity Comparison | Category | v0 Metric | v1 Metric | Parity | |----------|-----------|-----------|--------| | **Generate - Request Count** | `generator/generate/count_requests` (SUM) | `generator/generate/count_requests` (SUM) | ✅ Same | | **Generate - Completion Count** | `generator/generate/count_sequences_completed` (SUM) | `generator/generate/count_sequences_completed` (SUM) | ✅ Same | | **Generate - E2E Timing** | `generator_perf/generate/*` (Tracer, GPU) | `generator_perf/generate/*` (Tracer, GPU) | ✅ Same | | **Update - Pending Requests** | `generator_perf/update_weights/sum_pending_gen_requests` (SUM) | N/A - AsyncLLM handles internally | ⚠️ Skip (by design) | | **Update - Wait for Generation** | `generator_perf/update_weights/avg_waiting_for_generation_duration_s` (MEAN) | `generator_perf/update_weights/pause_generation_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Update - Fetch Weights** | `generator_perf/update_weights/wait_fetch_weights` (MEAN) | `generator_perf/update_weights/worker_load_weights_duration_s` (MEAN) | ✅ Equivalent - renamed for clarity | | **Worker - Update Timing** | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | `generator_perf/update_weights/generator_worker_update/*` (trace, GPU) | ✅ Same | ## Test Plan Main GRPO app: `python -m apps.grpo.main --config apps/grpo/qwen3_1_7b.yaml` ``` wandb: Run `wandb offline` to turn off syncing. wandb: Syncing run drawn-waterfall-686 wandb: ⭐️ View project at https://meta.wandb.io/jiyue/grpo-training wandb: 🚀 View run at https://meta.wandb.io/jiyue/grpo-training/runs/6pltx38p wandb: Detected [openai] in use. .... rvability.metric_actors.GlobalLoggingActor global_logger>] === [global_reduce] - METRICS STEP 1 === ... generator/generate/count_requests: 13.0 generator/generate/count_sequences_completed: 96.0 generator_perf/generate/total_duration_avg_s: 3.6518315022786463 generator_perf/generate/total_duration_max_s: 9.2080615234375 generator_perf/update_weights/pause_generation_duration_s: 2.8634108749683946 generator_perf/update_weights/resume_generation_duration_s: 1.918897032737732e-05 generator_perf/update_weights/worker_load_weights_duration_s: 3.506648204056546 ... ``` Make sure integration tests that do not initialize the tracer still works `pytest tests/integration_tests/test_generator_lifecycle.py -v -s` ## Next Steps [ ] implement the prefetch logic & shared memory [-] Add metric similar to generator v0 [ ] Perf/Throughput testing compared to generator v0 Reviewed By: allenwang28 Differential Revision: D91038187

meta-cla Bot added the CLA Signed This label is managed by the Meta Open Source bot. label Jan 21, 2026

meta-codesync Bot added fb-exported meta-exported labels Jan 21, 2026

JenniferWang linked an issue Jan 21, 2026 that may be closed by this pull request

[vLLM v0.13] Re-architect forge's integration with vLLM (generator.py) #669

Closed

2 tasks

facebook-github-bot force-pushed the export-D91038187 branch from 6ffde9c to 072695e Compare January 21, 2026 13:59

allenwang28 approved these changes Jan 22, 2026

View reviewed changes

facebook-github-bot force-pushed the export-D91038187 branch from 072695e to dc35fed Compare January 26, 2026 16:31

allenwang28 approved these changes Jan 26, 2026

View reviewed changes

felipemello1 approved these changes Jan 26, 2026

View reviewed changes

facebook-github-bot force-pushed the export-D91038187 branch from dc35fed to 4f53917 Compare January 26, 2026 20:12

JenniferWang merged commit 58bf8e3 into main Jan 26, 2026
12 checks passed

HosseinKaviani-H pushed a commit to HosseinKaviani-H/forge that referenced this pull request Feb 9, 2026

add tracer in v1 to log generator perf metrics (meta-pytorch#720)

d2c4b86

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add tracer in v1 to log generator perf metrics#720

add tracer in v1 to log generator perf metrics#720
JenniferWang merged 1 commit into
mainfrom
export-D91038187

JenniferWang commented Jan 21, 2026

Uh oh!

meta-codesync Bot commented Jan 21, 2026

Uh oh!

allenwang28 left a comment

Uh oh!

codecov-commenter commented Jan 26, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

Conversation

JenniferWang commented Jan 21, 2026

tl;dr

V0 vs V1 Metrics Parity Comparison

Test Plan

Next Steps

Uh oh!

meta-codesync Bot commented Jan 21, 2026

Uh oh!

allenwang28 left a comment

Choose a reason for hiding this comment

Uh oh!

codecov-commenter commented Jan 26, 2026

Codecov Report

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants