Fix torch complier error (#127)

loubbrad · web-flow · commit 4e9a8fb965b8 · 2025-12-23T21:44:23.000+09:00
* fix temp in demo

* update

* fix compile
diff --git a/aria/inference/model_cuda.py b/aria/inference/model_cuda.py
@@ -109,7 +109,6 @@ def _att_block(
         freqs_cis: torch.Tensor,
         mask: torch.Tensor,
     ):
-
         q, k, v = self.mixed_qkv(x).split(
             [self.d_model, self.d_model, self.d_model], dim=-1
         )
@@ -166,7 +165,7 @@ def fill_condition_kv(self, emb: torch.Tensor):
         assert self.model_config.emb_size is not None
 
         input_pos = torch.tensor([0], device=emb.device)
-        mask = self.causal_mask[None, None, input_pos]
+        mask = self.causal_mask[input_pos].unsqueeze(0).unsqueeze(0)
         freqs_cis = self.freqs_cis[input_pos]
 
         x = emb.unsqueeze(dim=1)
@@ -182,7 +181,7 @@ def forward(
     ):
         assert self.freqs_cis is not None, "Caches must be initialized first"
 
-        mask = self.causal_mask[None, None, input_pos]
+        mask = self.causal_mask[input_pos].unsqueeze(0).unsqueeze(0)
 
         if pad_idxs is not None:
             mask = mask & ~(pad_idxs.unsqueeze(1).unsqueeze(1))