Refactor tensor creation methods to use static factory methods and remove redundant constructors.

orionpapadakis · orionpapadakis · commit cec6c9dbf1ce · 2025-11-25T16:06:47.000+02:00
diff --git a/src/main/java/org/beehive/gpullama3/model/loader/ModelLoader.java b/src/main/java/org/beehive/gpullama3/model/loader/ModelLoader.java
@@ -126,8 +126,8 @@ public static TornadoTensor loadTornadoTensor(GGMLTensorEntry entry) {
         GGMLType ggmlType = entry.ggmlType();
         int size = FloatTensor.numberOfElements(entry.shape());
         return switch (ggmlType) {
-            case F32 -> new FP32TornadoTensor(size, entry.memorySegment());
-            case F16 -> new FP16TornadoTensor(size, entry.memorySegment());
+            case F32 -> FP32TornadoTensor.fromTornadoMemorySegment(entry.memorySegment());
+            case F16 -> FP16TornadoTensor.fromTornadoMemorySegment(entry.memorySegment());
             case Q8_0 -> Q8_0TornadoTensor.create(entry);
             case Q4_0 -> throw new UnsupportedOperationException("Q4 format not supported yet");
             default -> throw new UnsupportedOperationException("Quantization format " + ggmlType);
diff --git a/src/main/java/org/beehive/gpullama3/tensor/tornado/FP16TornadoTensor.java b/src/main/java/org/beehive/gpullama3/tensor/tornado/FP16TornadoTensor.java
@@ -13,8 +13,8 @@ public FP16TornadoTensor(HalfFloatArray halfFloatArray) {
         this.tornadoNativeArray = halfFloatArray;
     }
 
-    public FP16TornadoTensor(MemorySegment segment) {
-        this.tornadoNativeArray = new HalfFloatArray(segment);
+    public static FP16TornadoTensor fromTornadoMemorySegment(MemorySegment segment) {
+        return new FP16TornadoTensor(HalfFloatArray.fromSegmentShallow(segment));
     }
 
     @Override
diff --git a/src/main/java/org/beehive/gpullama3/tensor/tornado/FP32TornadoTensor.java b/src/main/java/org/beehive/gpullama3/tensor/tornado/FP32TornadoTensor.java
@@ -12,8 +12,8 @@ public FP32TornadoTensor(FloatArray floatArray) {
         this.tornadoNativeArray = floatArray;
     }
 
-    public FP32TornadoTensor(MemorySegment segment) {
-        this.tornadoNativeArray = new FloatArray(segment);
+    public static FP32TornadoTensor fromTornadoMemorySegment(MemorySegment segment) {
+        return new FP32TornadoTensor(FloatArray.fromSegmentShallow(segment));
     }
 
     @Override
diff --git a/src/main/java/org/beehive/gpullama3/tensor/tornado/Q8_0TornadoTensor.java b/src/main/java/org/beehive/gpullama3/tensor/tornado/Q8_0TornadoTensor.java
@@ -41,11 +41,6 @@ public Int8Array getQuants() {
         return quants;
     }
 
-    @Override
-    public int size() {
-        return size;
-    }
-
     @Override
     public GGMLType type() {
         return GGMLType.Q8_0;
@@ -62,7 +57,7 @@ public MemorySegment asMemorySegment() {
      * @return Dequantized float value
      */
     public float getFloat(int index) {
-        assert 0 <= index && index < size;
+        assert 0 <= index;
         int blockIdx = index / GGMLType.Q8_0.getBlockSize();
         float scale = scales.get(blockIdx).getFloat32();
         byte quant = quants.get(index);
@@ -108,6 +103,6 @@ public static Q8_0TornadoTensor create(GGMLTensorEntry entry) {
             }
         }
 
-        return new Q8_0TornadoTensor(size, scales, quants, q8Segment);
+        return new Q8_0TornadoTensor(scales, quants, q8Segment);
     }
 }

Original file line number	Diff line number	Diff line change
`@@ -13,8 +13,8 @@ public FP16TornadoTensor(HalfFloatArray halfFloatArray) {`
`13`	`13`	`this.tornadoNativeArray = halfFloatArray;`
`14`	`14`	`}`
`15`	`15`
`16`		`- public FP16TornadoTensor(MemorySegment segment) {`
`17`		`- this.tornadoNativeArray = new HalfFloatArray(segment);`
	`16`	`+ public static FP16TornadoTensor fromTornadoMemorySegment(MemorySegment segment) {`
	`17`	`+ return new FP16TornadoTensor(HalfFloatArray.fromSegmentShallow(segment));`
`18`	`18`	`}`
`19`	`19`
`20`	`20`	`@Override`
Original file line number	Diff line number	Diff line change
`@@ -12,8 +12,8 @@ public FP32TornadoTensor(FloatArray floatArray) {`
`12`	`12`	`this.tornadoNativeArray = floatArray;`
`13`	`13`	`}`
`14`	`14`
`15`		`- public FP32TornadoTensor(MemorySegment segment) {`
`16`		`- this.tornadoNativeArray = new FloatArray(segment);`
	`15`	`+ public static FP32TornadoTensor fromTornadoMemorySegment(MemorySegment segment) {`
	`16`	`+ return new FP32TornadoTensor(FloatArray.fromSegmentShallow(segment));`
`17`	`17`	`}`
`18`	`18`
`19`	`19`	`@Override`
Original file line number	Diff line number	Diff line change
`@@ -41,11 +41,6 @@ public Int8Array getQuants() {`
`41`	`41`	`return quants;`
`42`	`42`	`}`
`43`	`43`
`44`		`- @Override`
`45`		`- public int size() {`
`46`		`- return size;`
`47`		`- }`
`48`		`-`
`49`	`44`	`@Override`
`50`	`45`	`public GGMLType type() {`
`51`	`46`	`return GGMLType.Q8_0;`
`@@ -62,7 +57,7 @@ public MemorySegment asMemorySegment() {`
`62`	`57`	`* @return Dequantized float value`
`63`	`58`	`*/`
`64`	`59`	`public float getFloat(int index) {`
`65`		`- assert 0 <= index && index < size;`
	`60`	`+ assert 0 <= index;`
`66`	`61`	`int blockIdx = index / GGMLType.Q8_0.getBlockSize();`
`67`	`62`	`float scale = scales.get(blockIdx).getFloat32();`
`68`	`63`	`byte quant = quants.get(index);`
`@@ -108,6 +103,6 @@ public static Q8_0TornadoTensor create(GGMLTensorEntry entry) {`
`108`	`103`	`}`
`109`	`104`	`}`
`110`	`105`
`111`		`- return new Q8_0TornadoTensor(size, scales, quants, q8Segment);`
	`106`	`+ return new Q8_0TornadoTensor(scales, quants, q8Segment);`
`112`	`107`	`}`
`113`	`108`	`}`