Name	Name	Last commit message	Last commit date
parent directory ..
README.md	README.md
basic_inference.exs	basic_inference.exs
genserver_pool.exs	genserver_pool.exs
hot_reload.exs	hot_reload.exs
telemetry_dashboard.exs	telemetry_dashboard.exs

Name

Last commit message

Last commit date

telemetry_dashboard.exs

ExTorch Model Serving Examples

Production deployment patterns for serving PyTorch models from Elixir.

Quick Start

# Generate model fixtures
cd ../..
.venv/bin/python test/fixtures/generate_popular_models.py
.venv/bin/python test/fixtures/generate_aoti_popular_models.py --device cuda

# Run any example
mix run examples/serving/basic_inference.exs
mix run examples/serving/genserver_pool.exs
mix run examples/serving/telemetry_dashboard.exs
mix run examples/serving/hot_reload.exs

Examples

1. `basic_inference.exs` — Three Inference Paths

Demonstrates the three ways to run a model, when to use each, and relative performance:

Export (forward/2) — Elixir interpreter, good for debugging
Export Native (forward_native/2) — C++ graph executor, production-ready
AOTI — Compiled kernels, fastest

2. `genserver_pool.exs` — Supervised Model Pool

Production-grade serving with:

Multiple model replicas behind a pool
Request routing with backpressure
Graceful degradation on failure
Per-model telemetry

3. `telemetry_dashboard.exs` — Metrics and Monitoring

Live inference metrics using ExTorch.Metrics:

Latency percentiles (p50/p95/p99)
Throughput (inferences/sec)
Error rate tracking
Integration with Phoenix LiveDashboard

4. `hot_reload.exs` — Zero-Downtime Model Updates

Swap models without dropping requests:

Load new model in background
Atomic swap via GenServer state
Drain in-flight requests to old model
Rollback on load failure

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

ExTorch Model Serving Examples

Quick Start

Examples

1. `basic_inference.exs` — Three Inference Paths

2. `genserver_pool.exs` — Supervised Model Pool

3. `telemetry_dashboard.exs` — Metrics and Monitoring

4. `hot_reload.exs` — Zero-Downtime Model Updates

FilesExpand file tree

serving

Directory actions

More options

Directory actions

More options

Latest commit

History

serving

Folders and files

parent directory

README.md

ExTorch Model Serving Examples

Quick Start

Examples

1. basic_inference.exs — Three Inference Paths

2. genserver_pool.exs — Supervised Model Pool

3. telemetry_dashboard.exs — Metrics and Monitoring

4. hot_reload.exs — Zero-Downtime Model Updates

1. `basic_inference.exs` — Three Inference Paths

2. `genserver_pool.exs` — Supervised Model Pool

3. `telemetry_dashboard.exs` — Metrics and Monitoring

4. `hot_reload.exs` — Zero-Downtime Model Updates