InfiniTensor
diff --git a/‎attention.py‎
Lines changed: 0 additions & 382 deletions b/‎attention.py‎
Lines changed: 0 additions & 382 deletions
diff --git a/‎infer.py‎
Lines changed: 1 addition & 1 deletion b/‎infer.py‎
Lines changed: 1 addition & 1 deletion
@@ -2,9 +2,9 @@
 
 from transformers import AutoModelForCausalLM, AutoTokenizer
 
-from attention import Attention
 from fused_rms_norm import RMSNorm
 from linear import Linear
+from scaled_dot_product_attention import Attention
 from silu import SiLU
 from utils import replace_module