FasterAI-Labs
diff --git a/‎fasterbench/energy.py‎
Lines changed: 1 addition & 1 deletion b/‎fasterbench/energy.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎fasterbench/profiling.py‎
Lines changed: 1 addition & 1 deletion b/‎fasterbench/profiling.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎fasterbench/speed.py‎
Lines changed: 1 addition & 1 deletion b/‎fasterbench/speed.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎nbs/analysis/profiling.ipynb‎
Lines changed: 223 additions & 2 deletions b/‎nbs/analysis/profiling.ipynb‎
Lines changed: 223 additions & 2 deletions
diff --git a/‎nbs/metrics/energy.ipynb‎
Lines changed: 125 additions & 2 deletions b/‎nbs/metrics/energy.ipynb‎
Lines changed: 125 additions & 2 deletions
@@ -65,7 +65,7 @@ def _clear_stale_codecarbon_lock() -> None:
 
 
 #| export
-@torch.inference_mode()
+@torch.no_grad()
 def compute_energy(
     model: torch.nn.Module,                  # model to benchmark
     sample: torch.Tensor,                    # input tensor (with batch dimension)
 
@@ -157,7 +157,7 @@ def hook(mod, inp, output):
 }
 
 
-@torch.inference_mode()
+@torch.no_grad()
 def _profile_layers(
     model: nn.Module,              # model to profile
     sample: torch.Tensor,          # input tensor (with batch dimension)
 
@@ -98,7 +98,7 @@ def _forward_latencies(
 
 
 #| export
-@torch.inference_mode()
+@torch.no_grad()
 def compute_speed(
     model: nn.Module,                    # model to benchmark
     sample: torch.Tensor,                # input tensor (with batch dimension)
 
@@ -42,7 +42,130 @@
    "id": "58dcf143",
    "metadata": {},
    "outputs": [],
-   "source": "#| export\n@dataclass(slots=True)\nclass EnergyMetrics:\n    \"\"\"Energy consumption and carbon footprint metrics.\"\"\"\n    mean_watts: float   # average power during measurement\n    energy_wh: float    # Wh per inference\n    co2_eq_g: float     # g CO₂-eq per inference\n\n    def as_dict(self) -> dict[str, float]:\n        return asdict(self)\n\n\n#| export\ndef _nan_energy_metrics(device: str) -> EnergyMetrics:  # device string (unused, for consistent signature)\n    \"\"\"Create EnergyMetrics with NaN values for failed benchmarks.\"\"\"\n    nan = float(\"nan\")\n    return EnergyMetrics(nan, nan, nan)\n\n\n#| export\ndef _clear_stale_codecarbon_lock() -> None:\n    \"\"\"Remove stale codecarbon lock file if the owning process no longer exists.\"\"\"\n    import tempfile\n    lock_path = os.path.join(tempfile.gettempdir(), \".codecarbon.lock\")\n    if not os.path.exists(lock_path):\n        return\n    try:\n        # Read the PID from the lock file (codecarbon writes its PID there)\n        with open(lock_path) as f:\n            content = f.read().strip()\n        if content:\n            pid = int(content)\n            os.kill(pid, 0)  # Check if process exists (signal 0 = no-op)\n            # Process exists — lock is valid, don't remove\n            return\n    except (ValueError, ProcessLookupError, PermissionError, OSError):\n        pass  # PID invalid or process dead — lock is stale\n    try:\n        os.remove(lock_path)\n    except OSError:\n        pass\n\n\n#| export\n@torch.inference_mode()\ndef compute_energy(\n    model: torch.nn.Module,                  # model to benchmark\n    sample: torch.Tensor,                    # input tensor (with batch dimension)\n    *,\n    device: str | torch.device = \"cpu\",      # device to run on\n    warmup: int = 20,                        # warmup iterations\n    steps: int = 100,                        # measurement iterations\n    offline: bool = True,                    # use offline emissions tracker\n    country_iso: str | None = None,          # country ISO code for carbon intensity\n    measure_secs: int = 1,                   # power sampling interval\n) -> EnergyMetrics:\n    \"\"\"Measure power consumption and carbon footprint using codecarbon.\"\"\"\n    if EmissionsTracker is None:\n        warnings.warn(\"codecarbon not installed – returning NaNs\")\n        return _nan_energy_metrics(str(device))\n\n    _clear_stale_codecarbon_lock()\n\n    Tracker = OfflineEmissionsTracker if offline else EmissionsTracker\n    tracker = Tracker(\n        project_name=\"fasterbench\",\n        country_iso_code=(country_iso or os.getenv(\"NNBENCH_ISO\", \"USA\")),\n        measure_power_secs=measure_secs,\n        save_to_file=False,\n        log_level=\"critical\",\n    )\n\n    with _device_ctx(device) as dev:\n        model = model.eval().to(dev)\n        sample = sample.to(dev, non_blocking=True)\n\n        for _ in range(warmup):\n            model(sample)\n        _sync(dev)\n\n        tracker.start()\n        try:\n            t0 = time.perf_counter()\n            for _ in range(steps):\n                model(sample)\n            _sync(dev)\n        finally:\n            tracker.stop()\n        dur_s = time.perf_counter() - t0\n\n    # codecarbon silently fails if another instance is running,\n    # leaving final_emissions_data as None\n    if tracker.final_emissions_data is None:\n        warnings.warn(\"codecarbon tracker did not collect data (another instance may be running)\")\n        return _nan_energy_metrics(str(device))\n\n    ene_kwh = tracker.final_emissions_data.energy_consumed\n    co2_kg = tracker.final_emissions\n    mean_w = (ene_kwh * 3600_000) / dur_s\n\n    return EnergyMetrics(\n        mean_watts=mean_w,\n        energy_wh=(ene_kwh * 1_000) / steps,\n        co2_eq_g=(co2_kg * 1_000) / steps,\n    )\n\n\n#| export\ndef compute_energy_multi(\n    model: torch.nn.Module,                                # model to benchmark\n    sample: torch.Tensor,                                  # input tensor (with batch dimension)\n    *,\n    devices: Sequence[str | torch.device] | None = None,   # devices to benchmark (default: cpu + cuda)\n    **kwargs,\n) -> dict[str, EnergyMetrics]:\n    \"\"\"Measure energy on multiple devices.\"\"\"\n    return _run_on_devices(\n        compute_energy, model, sample, devices,\n        nan_factory=_nan_energy_metrics,\n        metric_name=\"Energy\",\n        **kwargs\n    )"
+   "source": [
+    "#| export\n",
+    "@dataclass(slots=True)\n",
+    "class EnergyMetrics:\n",
+    "    \"\"\"Energy consumption and carbon footprint metrics.\"\"\"\n",
+    "    mean_watts: float   # average power during measurement\n",
+    "    energy_wh: float    # Wh per inference\n",
+    "    co2_eq_g: float     # g CO₂-eq per inference\n",
+    "\n",
+    "    def as_dict(self) -> dict[str, float]:\n",
+    "        return asdict(self)\n",
+    "\n",
+    "\n",
+    "#| export\n",
+    "def _nan_energy_metrics(device: str) -> EnergyMetrics:  # device string (unused, for consistent signature)\n",
+    "    \"\"\"Create EnergyMetrics with NaN values for failed benchmarks.\"\"\"\n",
+    "    nan = float(\"nan\")\n",
+    "    return EnergyMetrics(nan, nan, nan)\n",
+    "\n",
+    "\n",
+    "#| export\n",
+    "def _clear_stale_codecarbon_lock() -> None:\n",
+    "    \"\"\"Remove stale codecarbon lock file if the owning process no longer exists.\"\"\"\n",
+    "    import tempfile\n",
+    "    lock_path = os.path.join(tempfile.gettempdir(), \".codecarbon.lock\")\n",
+    "    if not os.path.exists(lock_path):\n",
+    "        return\n",
+    "    try:\n",
+    "        # Read the PID from the lock file (codecarbon writes its PID there)\n",
+    "        with open(lock_path) as f:\n",
+    "            content = f.read().strip()\n",
+    "        if content:\n",
+    "            pid = int(content)\n",
+    "            os.kill(pid, 0)  # Check if process exists (signal 0 = no-op)\n",
+    "            # Process exists — lock is valid, don't remove\n",
+    "            return\n",
+    "    except (ValueError, ProcessLookupError, PermissionError, OSError):\n",
+    "        pass  # PID invalid or process dead — lock is stale\n",
+    "    try:\n",
+    "        os.remove(lock_path)\n",
+    "    except OSError:\n",
+    "        pass\n",
+    "\n",
+    "\n",
+    "#| export\n",
+    "@torch.no_grad()\n",
+    "def compute_energy(\n",
+    "    model: torch.nn.Module,                  # model to benchmark\n",
+    "    sample: torch.Tensor,                    # input tensor (with batch dimension)\n",
+    "    *,\n",
+    "    device: str | torch.device = \"cpu\",      # device to run on\n",
+    "    warmup: int = 20,                        # warmup iterations\n",
+    "    steps: int = 100,                        # measurement iterations\n",
+    "    offline: bool = True,                    # use offline emissions tracker\n",
+    "    country_iso: str | None = None,          # country ISO code for carbon intensity\n",
+    "    measure_secs: int = 1,                   # power sampling interval\n",
+    ") -> EnergyMetrics:\n",
+    "    \"\"\"Measure power consumption and carbon footprint using codecarbon.\"\"\"\n",
+    "    if EmissionsTracker is None:\n",
+    "        warnings.warn(\"codecarbon not installed – returning NaNs\")\n",
+    "        return _nan_energy_metrics(str(device))\n",
+    "\n",
+    "    _clear_stale_codecarbon_lock()\n",
+    "\n",
+    "    Tracker = OfflineEmissionsTracker if offline else EmissionsTracker\n",
+    "    tracker = Tracker(\n",
+    "        project_name=\"fasterbench\",\n",
+    "        country_iso_code=(country_iso or os.getenv(\"NNBENCH_ISO\", \"USA\")),\n",
+    "        measure_power_secs=measure_secs,\n",
+    "        save_to_file=False,\n",
+    "        log_level=\"critical\",\n",
+    "    )\n",
+    "\n",
+    "    with _device_ctx(device) as dev:\n",
+    "        model = model.eval().to(dev)\n",
+    "        sample = sample.to(dev, non_blocking=True)\n",
+    "\n",
+    "        for _ in range(warmup):\n",
+    "            model(sample)\n",
+    "        _sync(dev)\n",
+    "\n",
+    "        tracker.start()\n",
+    "        try:\n",
+    "            t0 = time.perf_counter()\n",
+    "            for _ in range(steps):\n",
+    "                model(sample)\n",
+    "            _sync(dev)\n",
+    "        finally:\n",
+    "            tracker.stop()\n",
+    "        dur_s = time.perf_counter() - t0\n",
+    "\n",
+    "    # codecarbon silently fails if another instance is running,\n",
+    "    # leaving final_emissions_data as None\n",
+    "    if tracker.final_emissions_data is None:\n",
+    "        warnings.warn(\"codecarbon tracker did not collect data (another instance may be running)\")\n",
+    "        return _nan_energy_metrics(str(device))\n",
+    "\n",
+    "    ene_kwh = tracker.final_emissions_data.energy_consumed\n",
+    "    co2_kg = tracker.final_emissions\n",
+    "    mean_w = (ene_kwh * 3600_000) / dur_s\n",
+    "\n",
+    "    return EnergyMetrics(\n",
+    "        mean_watts=mean_w,\n",
+    "        energy_wh=(ene_kwh * 1_000) / steps,\n",
+    "        co2_eq_g=(co2_kg * 1_000) / steps,\n",
+    "    )\n",
+    "\n",
+    "\n",
+    "#| export\n",
+    "def compute_energy_multi(\n",
+    "    model: torch.nn.Module,                                # model to benchmark\n",
+    "    sample: torch.Tensor,                                  # input tensor (with batch dimension)\n",
+    "    *,\n",
+    "    devices: Sequence[str | torch.device] | None = None,   # devices to benchmark (default: cpu + cuda)\n",
+    "    **kwargs,\n",
+    ") -> dict[str, EnergyMetrics]:\n",
+    "    \"\"\"Measure energy on multiple devices.\"\"\"\n",
+    "    return _run_on_devices(\n",
+    "        compute_energy, model, sample, devices,\n",
+    "        nan_factory=_nan_energy_metrics,\n",
+    "        metric_name=\"Energy\",\n",
+    "        **kwargs\n",
+    "    )"
+   ]
   },
   {
    "cell_type": "code",
@@ -94,4 +217,4 @@
  "metadata": {},
  "nbformat": 4,
  "nbformat_minor": 5
-}
+}
Original file line number	Diff line number	Diff line change
`@@ -157,7 +157,7 @@ def hook(mod, inp, output):`
`157`	`157`	`}`
`158`	`158`
`159`	`159`
`160`		`-@torch.inference_mode()`
	`160`	`+@torch.no_grad()`
`161`	`161`	`def _profile_layers(`
`162`	`162`	`model: nn.Module, # model to profile`
`163`	`163`	`sample: torch.Tensor, # input tensor (with batch dimension)`