davisking · kSkip · Feb 10, 2026 · Feb 10, 2026 · davisking · Feb 15, 2026
diff --git a/dlib/cuda/gpu_data.cpp b/dlib/cuda/gpu_data.cpp
@@ -59,15 +59,25 @@ namespace dlib
             {
                 // copy the memory efficiently based on which copy is current in each object.
                 if (src.device_ready())
-                    CHECK_CUDA(cudaMemcpy(dest.device_write_only(), src.device()+src_offset,  num*sizeof(float), cudaMemcpyDeviceToDevice));
+                {
+                    if (dest.device_id() != src.device_id())
+                        CHECK_CUDA(cudaMemcpyPeer(dest.device_write_only(), dest.device_id(), src.device()+src_offset, src.device_id(), num*sizeof(float)));
+                    else
+                        CHECK_CUDA(cudaMemcpy(dest.device_write_only(), src.device()+src_offset,  num*sizeof(float), cudaMemcpyDeviceToDevice));
+                }
                 else 
                     CHECK_CUDA(cudaMemcpy(dest.device_write_only(), src.host()+src_offset,    num*sizeof(float), cudaMemcpyHostToDevice));
             }
             else
             {
                 // copy the memory efficiently based on which copy is current in each object.
                 if (dest.device_ready() && src.device_ready())
-                    CHECK_CUDA(cudaMemcpy(dest.device()+dest_offset, src.device()+src_offset, num*sizeof(float), cudaMemcpyDeviceToDevice));
+                {
+                    if (dest.device_id() != src.device_id())
+                        CHECK_CUDA(cudaMemcpyPeer(dest.device()+dest_offset, dest.device_id(), src.device()+src_offset, src.device_id(), num*sizeof(float)));
+                    else
+                        CHECK_CUDA(cudaMemcpy(dest.device()+dest_offset, src.device()+src_offset, num*sizeof(float), cudaMemcpyDeviceToDevice));
+                }
                 else if (!dest.device_ready() && src.device_ready())
                     CHECK_CUDA(cudaMemcpy(dest.host()+dest_offset, src.device()+src_offset,   num*sizeof(float), cudaMemcpyDeviceToHost));
                 else if (dest.device_ready() && !src.device_ready())