[Docs] Fix inline backticks in RNN CN docs

Noai-oss · Noai-oss · commit 7edb33246c87 · 2026-03-12T22:04:56.000+08:00
diff --git a/docs/api/paddle/nn/GRU_cn.rst b/docs/api/paddle/nn/GRU_cn.rst
@@ -36,7 +36,7 @@ GRU
     - **hidden_size** (int) - 隐藏状态 :math:`h` 大小。
     - **num_layers** (int，可选) - 循环网络的层数。例如，将层数设为 2，会将两层 GRU 网络堆叠在一起，第二层的输入来自第一层的输出。默认为 1。
     - **direction** (str，可选) - 网络迭代方向，可设置为 forward 或 bidirect（或 bidirectional）。forward 指从序列开始到序列结束的单向 GRU 网络方向，bidirectional 指从序列开始到序列结束，又从序列结束到开始的双向 GRU 网络方向。默认为 forward。
-    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，否则为[batch_size,time_steps,input_size]。`time_steps` 指输入序列的长度。默认为 False。
+    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，否则为[batch_size,time_steps,input_size]。``time_steps`` 指输入序列的长度。默认为 False。
     - **dropout** (float，可选) - dropout 概率，指的是出第一层外每层输入时的 dropout 概率。范围为[0, 1]。默认为 0。
     - **weight_ih_attr** (ParamAttr，可选) - weight_ih 的参数。默认为 None。
     - **weight_hh_attr** (ParamAttr，可选) - weight_hh 的参数。默认为 None。
@@ -47,14 +47,14 @@ GRU
 输入
 ::::::::::::
 
-    - **inputs** (Tensor) - 网络输入。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]。`time_steps` 指输入序列的长度。
+    - **inputs** (Tensor) - 网络输入。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]。``time_steps`` 指输入序列的长度。
     - **initial_states** (Tensor，可选) - 网络的初始状态，形状为[num_layers * num_directions, batch_size, hidden_size]。如果没有给出则会以全零初始化。
     - **sequence_length** (Tensor，可选) - 指定输入序列的实际长度，形状为[batch_size]，数据类型为 int64 或 int32。在输入序列中所有 time step 不小于 sequence_length 的元素都会被当作填充元素处理（状态不再更新）。
 
 输出
 ::::::::::::
 
-    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,num_directions * hidden_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。`time_steps` 指输出序列的长度。
+    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,num_directions * hidden_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。``time_steps`` 指输出序列的长度。
     - **final_states** (Tensor) - 最终状态。形状为[num_layers * num_directions, batch_size, hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，返回值的前向和后向的状态的索引是 0，2，4，6..。和 1，3，5，7...，否则等于 1。
 
 代码示例
diff --git a/docs/api/paddle/nn/LSTMCell_cn.rst b/docs/api/paddle/nn/LSTMCell_cn.rst
@@ -23,7 +23,7 @@ LSTMCell
         h_{t} &= o_{t} * \tanh (c_{t})\\
         y_{t} &= h_{t}
 
-若设置了 `proj_size`，隐状态 :math:`h_{t}` 将会被映射到指定维度：
+若设置了 ``proj_size``，隐状态 :math:`h_{t}` 将会被映射到指定维度：
 
 .. math::
         h_{t} = h_{t} * W_{proj\_size}
@@ -45,7 +45,7 @@ LSTMCell
     - **weight_hh_attr** (ParamAttr，可选) - weight_hh 的参数。默认为 None。
     - **bias_ih_attr** (ParamAttr，可选) - bias_ih 的参数。默认为 None。
     - **bias_hh_attr** (ParamAttr，可选) - bias_hh 的参数。默认为 None。
-    - **proj_size** (int，可选) - 若大于 0，则会使用投影层将隐状态隐射到指定大小，其值必须小于 `hidden_size` 。默认为 0。
+    - **proj_size** (int，可选) - 若大于 0，则会使用投影层将隐状态隐射到指定大小，其值必须小于 ``hidden_size`` 。默认为 0。
     - **name** (str，可选) - 具体用法请参见 :ref:`api_guide_Name`，一般无需设置，默认值为 None。
 
 变量
@@ -65,8 +65,8 @@ LSTMCell
 输出
 ::::::::::::
 
-    - **outputs** (Tensor) - 输出。形状为[batch_size, hidden_size]，对应公式中的 :math:`h_{t}`, 当设置了 `proj_size` 时，输出形状会被映射为[batch_size, proj_size]。
-    - **new_states** (tuple) - 一个包含两个 Tensor 的元组，每个 Tensor 的形状都为[batch_size, hidden_size]，新一轮的隐藏状态。形状为[batch_size, hidden_size]，对应公式中的 :math:`h_{t}，c_{t}`。当设置了 `proj_size` 时，:math:`h_{t}` 会被映射为[batch_size, proj_size]。
+    - **outputs** (Tensor) - 输出。形状为[batch_size, hidden_size]，对应公式中的 :math:`h_{t}`, 当设置了 ``proj_size`` 时，输出形状会被映射为[batch_size, proj_size]。
+    - **new_states** (tuple) - 一个包含两个 Tensor 的元组，每个 Tensor 的形状都为[batch_size, hidden_size]，新一轮的隐藏状态。形状为[batch_size, hidden_size]，对应公式中的 :math:`h_{t}，c_{t}`。当设置了 ``proj_size`` 时，:math:`h_{t}` 会被映射为[batch_size, proj_size]。
 
 .. note::
     所有的变换矩阵的权重和偏置都默认初始化为 Uniform(-std, std)，其中 std = :math:`\frac{1}{\sqrt{hidden\_size}}`。对于参数初始化，详情请参考 :ref:`cn_api_paddle_ParamAttr`。
diff --git a/docs/api/paddle/nn/LSTM_cn.rst b/docs/api/paddle/nn/LSTM_cn.rst
@@ -29,7 +29,7 @@ LSTM
 
         y_{t} & = h_{t}
 
-若设置了 `proj_size`，隐状态 :math:`h_{t}` 将会被映射到指定维度：
+若设置了 ``proj_size``，隐状态 :math:`h_{t}` 将会被映射到指定维度：
 
 .. math::
         h_{t} = h_{t} * W_{proj\_size}
@@ -44,27 +44,27 @@ LSTM
     - **hidden_size** (int) - 隐藏状态 :math:`h` 大小。
     - **num_layers** (int，可选) - 循环网络的层数。例如，将层数设为 2，会将两层 GRU 网络堆叠在一起，第二层的输入来自第一层的输出。默认为 1。
     - **direction** (str，可选) - 网络迭代方向，可设置为 forward 或 bidirect（或 bidirectional）。forward 指从序列开始到序列结束的单向 GRU 网络方向，bidirectional 指从序列开始到序列结束，又从序列结束到开始的双向 GRU 网络方向。默认为 forward。
-    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps, batch_size, input_size]，否则为[batch_size, time_steps, input_size]。`time_steps` 指输入序列的长度。默认为 False。
+    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps, batch_size, input_size]，否则为[batch_size, time_steps, input_size]。``time_steps`` 指输入序列的长度。默认为 False。
     - **dropout** (float，可选) - dropout 概率，指的是除第一层外每层输入时的 dropout 概率。范围为[0, 1]。默认为 0。
     - **weight_ih_attr** (ParamAttr，可选) - weight_ih 的参数。默认为 None。
     - **weight_hh_attr** (ParamAttr，可选) - weight_hh 的参数。默认为 None。
     - **bias_ih_attr** (ParamAttr，可选) - bias_ih 的参数。默认为 None。
     - **bias_hh_attr** (ParamAttr，可选) - bias_hh 的参数。默认为 None。
-    - **proj_size** (int，可选) - 若大于 0，则会使用投影层将隐状态隐射到指定大小，其值必须小于 `hidden_size` 。默认为 0。
+    - **proj_size** (int，可选) - 若大于 0，则会使用投影层将隐状态隐射到指定大小，其值必须小于 ``hidden_size`` 。默认为 0。
     - **name** (str，可选) - 具体用法请参见 :ref:`api_guide_Name`，一般无需设置，默认值为 None。
 
 输入
 ::::::::::::
 
-    - **inputs** (Tensor) - 网络输入。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]。`time_steps` 指输入序列的长度。
+    - **inputs** (Tensor) - 网络输入。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]。``time_steps`` 指输入序列的长度。
     - **initial_states** (tuple，可选) - 网络的初始状态，一个包含 h 和 c 的元组，形状为[num_layers * num_directions, batch_size, hidden_size]。如果没有给出则会以全零初始化。
     - **sequence_length** (Tensor，可选) - 指定输入序列的实际长度，形状为[batch_size]，数据类型为 int64 或 int32。在输入序列中所有 time step 不小于 sequence_length 的元素都会被当作填充元素处理（状态不再更新）。
 
 输出
 ::::::::::::
 
-    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 True，则 Tensor 的形状为[time_steps, batch_size, num_directions * hidden_size]，当设置了 `proj_size` 时，输出形状会被映射为[time_steps, batch_size, num_directions * proj_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。`time_steps` 指输出序列的长度。
-    - **final_states** (tuple) - 最终状态，一个包含 h 和 c 的元组。形状为[num_layers * num_directions, batch_size, hidden_size]，当设置了 `proj_size` 时， h 的形状会被映射为[num_layers * num_directions, batch_size, proj_size]。 当 direction 设置为 bidirectional 时，num_directions 等于 2，返回值的前向和后向的状态的索引是 0，2，4，6..。和 1，3，5，7...，否则等于 1。
+    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 True，则 Tensor 的形状为[time_steps, batch_size, num_directions * hidden_size]，当设置了 ``proj_size`` 时，输出形状会被映射为[time_steps, batch_size, num_directions * proj_size]，如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。``time_steps`` 指输出序列的长度。
+    - **final_states** (tuple) - 最终状态，一个包含 h 和 c 的元组。形状为[num_layers * num_directions, batch_size, hidden_size]，当设置了 ``proj_size`` 时， h 的形状会被映射为[num_layers * num_directions, batch_size, proj_size]。 当 direction 设置为 bidirectional 时，num_directions 等于 2，返回值的前向和后向的状态的索引是 0，2，4，6..。和 1，3，5，7...，否则等于 1。
 
 
 代码示例
diff --git a/docs/api/paddle/nn/RNNTLoss_cn.rst b/docs/api/paddle/nn/RNNTLoss_cn.rst
@@ -24,7 +24,7 @@ RNNTLoss
 
 返回
 :::::::::
-``Tensor``，输入 ``input`` 和标签 ``labels`` 间的 `rnnt loss`。如果 :attr:`reduction` 是 ``'none'``，则输出 loss 的维度为 [batch_size]。如果 :attr:`reduction` 是 ``'mean'`` 或 ``'sum'``，则输出 Loss 的维度为 []。数据类型与输入的 ``input`` 一致。
+``Tensor``，输入 ``input`` 和标签 ``labels`` 间的 ``rnnt loss``。如果 :attr:`reduction` 是 ``'none'``，则输出 loss 的维度为 [batch_size]。如果 :attr:`reduction` 是 ``'mean'`` 或 ``'sum'``，则输出 Loss 的维度为 []。数据类型与输入的 ``input`` 一致。
 
 代码示例
 :::::::::
diff --git a/docs/api/paddle/nn/SimpleRNNCell_cn.rst b/docs/api/paddle/nn/SimpleRNNCell_cn.rst
@@ -19,7 +19,7 @@ SimpleRNNCell
 
         y_{t} & = h_{t}
 
-其中的 `act` 表示激活函数。
+其中的 ``act`` 表示激活函数。
 
 详情请参考论文：`Finding Structure in Time <https://onlinelibrary.wiley.com/doi/pdf/10.1207/s15516709cog1402_1>`_ 。
 
diff --git a/docs/api/paddle/nn/SimpleRNN_cn.rst b/docs/api/paddle/nn/SimpleRNN_cn.rst
@@ -26,7 +26,7 @@ SimpleRNN
     - **hidden_size** (int) - 隐藏状态 :math:`h` 大小。
     - **num_layers** (int，可选) - 循环网络的层数。例如，将层数设为 2，会将两层 GRU 网络堆叠在一起，第二层的输入来自第一层的输出。默认为 1。
     - **direction** (str，可选) - 网络迭代方向，可设置为 forward 或 bidirect（或 bidirectional）。forward 指从序列开始到序列结束的单向 GRU 网络方向，bidirectional 指从序列开始到序列结束，又从序列结束到开始的双向 GRU 网络方向。默认为 forward。
-    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，否则为[batch_size,time_steps,input_size]。`time_steps` 指输入序列的长度。默认为 False。
+    - **time_major** (bool，可选) - 指定 input 的第一个维度是否是 time steps。如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]，否则为[batch_size,time_steps,input_size]。``time_steps`` 指输入序列的长度。默认为 False。
     - **dropout** (float，可选) - dropout 概率，指的是出第一层外每层输入时的 dropout 概率。范围为[0, 1]。默认为 0。
     - **activation** (str，可选) - 网络中每个单元的激活函数。可以是 tanh 或 relu。默认为 tanh。
     - **weight_ih_attr** (ParamAttr，可选) - weight_ih 的参数。默认为 None。
@@ -37,23 +37,23 @@ SimpleRNN
 输入
 ::::::::::::
 
-    - **inputs** (Tensor) - 网络输入。如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]，如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]。  `time_steps` 指输入序列的长度。
+    - **inputs** (Tensor) - 网络输入。如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,input_size]，如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,input_size]。  ``time_steps`` 指输入序列的长度。
     - **initial_states** (Tensor，可选) - 网络的初始状态，形状为[num_layers * num_directions, batch_size, hidden_size]。如果没有给出则会以全零初始化。
     - **sequence_length** (Tensor，可选) - 指定输入序列的实际长度，形状为[batch_size]，数据类型为 int64 或 int32。在输入序列中所有 time step 不小于 sequence_length 的元素都会被当作填充元素处理（状态不再更新）。
 
 输出
 ::::::::::::
 
-    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。 `time_steps` 指输出序列的长度。
+    - **outputs** (Tensor) - 输出，由前向和后向 cell 的输出拼接得到。如果 time_major 为 False，则 Tensor 的形状为[batch_size,time_steps,num_directions * hidden_size]，如果 time_major 为 True，则 Tensor 的形状为[time_steps,batch_size,num_directions * hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，否则等于 1。 ``time_steps`` 指输出序列的长度。
     - **final_states** (Tensor) - 最终状态。形状为[num_layers * num_directions, batch_size, hidden_size]，当 direction 设置为 bidirectional 时，num_directions 等于 2，返回值的前向和后向的状态的索引是 0，2，4，6..。和 1，3，5，7...，否则等于 1。
 
 变量
 ::::::::::::
 
-        - **weight_ih_l[k]** (Parameter) - 第 k 层输入层到隐藏层变换矩阵的权重，如果 `k = 0`，形状为 `[hidden_size, input_size]`。否则，形状为 `[hidden_size, num_directions * hidden_size]` 。
-        - **weight_hh_l[k]** (Parameter) - 第 k 层隐藏层到隐藏层变换矩阵的权重，形状为 `[hidden_size, hidden_size]` 。
-        - **bias_ih_l[k]** (Parameter) -  第 k 层输入层到隐藏层的变换矩阵的偏置，形状为 `[hidden_size]` 。
-        - **bias_hh_l[k]** (Parameter) - 第 k 层隐藏层到隐藏层的变换矩阵的偏置，形状为 `[hidden_size]` 。
+        - **weight_ih_l[k]** (Parameter) - 第 k 层输入层到隐藏层变换矩阵的权重，如果 ``k = 0``，形状为 ``[hidden_size, input_size]``。否则，形状为 ``[hidden_size, num_directions * hidden_size]`` 。
+        - **weight_hh_l[k]** (Parameter) - 第 k 层隐藏层到隐藏层变换矩阵的权重，形状为 ``[hidden_size, hidden_size]`` 。
+        - **bias_ih_l[k]** (Parameter) -  第 k 层输入层到隐藏层的变换矩阵的偏置，形状为 ``[hidden_size]`` 。
+        - **bias_hh_l[k]** (Parameter) - 第 k 层隐藏层到隐藏层的变换矩阵的偏置，形状为 ``[hidden_size]`` 。
 
 代码示例
 ::::::::::::