Skip to content

Commit 5252cf9

Browse files
committed
aula 15
1 parent 7215d66 commit 5252cf9

1 file changed

Lines changed: 3 additions & 3 deletions

File tree

material/aulas/aula15/index.md

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -27,7 +27,7 @@ Assim, a cada etapa o número de somas necessárias cai pela metade, logo o núm
2727
No código, o `stride` representa a distância entre os elementos que estão sendo somados em cada passo:
2828

2929
```cpp
30-
for (unsigned int stride = blockDim.x; stride > 0; stride /= 2) {
30+
for (int stride = blockDim.x; stride > 0; stride /= 2) {
3131
__syncthreads();
3232
if (t < stride)
3333
partialSum[t] += partialSum[t + stride];
@@ -82,7 +82,7 @@ __global__ void reduceShared(float *input, float *output, int N) {
8282
partialSum[blockDim.x + t] = 0.0f;
8383

8484
// Loop de redução: stride aumenta a cada passo (1, 2, 4, ..., blockDim.x)
85-
for (unsigned int stride = 1; stride <= blockDim.x; stride *= 2) {
85+
for (int stride = 1; stride <= blockDim.x; stride *= 2) {
8686
// Garante que todos os valores foram somados antes de prosseguir
8787
__syncthreads();
8888

@@ -132,7 +132,7 @@ Isso significa que, nas iterações iniciais, os warps executam de forma uniform
132132
Além de reduzir a divergência, essa abordagem também melhora a localidade espacial do código:
133133
134134
```cpp
135-
for (unsigned int stride = blockDim.x; stride > 0; stride /= 2) {
135+
for (int stride = blockDim.x; stride > 0; stride /= 2) {
136136
__syncthreads();
137137
if (t < stride)
138138
partialSum[t] += partialSum[t + stride];

0 commit comments

Comments
 (0)