WIP: Fix Windowed embedding to copy float data

prudhvi-qti · prudhvi-qti · commit 5719c9722551 · 2026-01-07T11:34:44.000-08:00
diff --git a/src/models/embeddings.cpp b/src/models/embeddings.cpp
@@ -114,7 +114,7 @@ void WindowedEmbeddings::Update(Embeddings& embeddings) {
     embeddings_ = OrtValue::CreateTensor(model_.p_device_inputs_->GetAllocator(), shape_, type_);
     std::copy_n(
         full_data,
-        window_size_ * hidden_size,
+        window_size_ * hidden_size * 2,
         embeddings_->GetTensorMutableData<uint16_t>());
 
   } else if (window_index_ < num_windows_) {
@@ -125,17 +125,17 @@ void WindowedEmbeddings::Update(Embeddings& embeddings) {
     };
     embeddings_ = OrtValue::CreateTensor(model_.p_device_inputs_->GetAllocator(), shape_, type_);
     std::copy_n(
-        full_data + window_index_ * window_size_ * hidden_size,
-        window_size_ * hidden_size,
+        full_data + window_index_ * window_size_ * hidden_size * 2,
+        window_size_ * hidden_size * 2,
         embeddings_->GetTensorMutableData<uint16_t>());
 
   } else {
     // Final token case (e.g., generated token)
     shape_ = {1, 1, hidden_size};
     embeddings_ = OrtValue::CreateTensor(model_.p_device_inputs_->GetAllocator(), shape_, type_);
     std::copy_n(
-        full_data + (sequence_length - 1) * hidden_size,
-        hidden_size,
+        full_data + (sequence_length - 1) * hidden_size * 2,
+        hidden_size * 2,
         embeddings_->GetTensorMutableData<uint16_t>());
 
   }