add ener direct fitting

iProzd · iProzd · commit 03ef8319cb4b · 2025-11-17T15:02:01.000+08:00
diff --git a/deepmd/pt/infer/deep_eval.py b/deepmd/pt/infer/deep_eval.py
@@ -535,10 +535,19 @@ def _eval_model(
                 out = batch_output[pt_name].reshape(shape).detach().cpu().numpy()
                 results.append(out)
             else:
-                shape = self._get_output_shape(odef, nframes, natoms)
-                results.append(
-                    np.full(np.abs(shape), np.nan, dtype=prec)
-                )  # this is kinda hacky
+                if (
+                    self._OUTDEF_DP2BACKEND[odef.name] == "force"
+                    and "dforce" in batch_output
+                ):
+                    # if no force, use dforce if possible
+                    shape = self._get_output_shape(odef, nframes, natoms)
+                    out = batch_output["dforce"].reshape(shape).detach().cpu().numpy()
+                    results.append(out)
+                else:
+                    shape = self._get_output_shape(odef, nframes, natoms)
+                    results.append(
+                        np.full(np.abs(shape), np.nan, dtype=prec)
+                    )  # this is kinda hacky
         return tuple(results)
 
     def _eval_model_spin(
diff --git a/deepmd/pt/loss/ener.py b/deepmd/pt/loss/ener.py
@@ -184,6 +184,9 @@ def forward(
             Other losses for display.
         """
         model_pred = model(**input_dict)
+
+        if "force" not in model_pred and "dforce" in model_pred:
+            model_pred["force"] = model_pred["dforce"]
         coef = learning_rate / self.starter_learning_rate
         pref_e = self.limit_pref_e + (self.start_pref_e - self.limit_pref_e) * coef
         pref_f = self.limit_pref_f + (self.start_pref_f - self.limit_pref_f) * coef
diff --git a/deepmd/pt/model/atomic_model/dp_atomic_model.py b/deepmd/pt/model/atomic_model/dp_atomic_model.py
@@ -286,6 +286,7 @@ def forward_atomic(
                 aparam=aparam,
                 sw=sw,
                 edge_index=add_input.get("edge_index", None),
+                diff=add_input.get("diff", None),
             )
         if self.enable_eval_fitting_last_layer_hook:
             assert "middle_output" in fit_ret, (
diff --git a/deepmd/pt/model/descriptor/repflows.py b/deepmd/pt/model/descriptor/repflows.py
@@ -573,6 +573,8 @@ def forward(
             h2 = h2[nlist_mask]
             # n_edge x 1
             sw = sw[nlist_mask]
+            # n_edge x 3
+            diff = diff[nlist_mask]
             # nb x nloc x a_nnei x a_nnei
             a_nlist_mask = a_nlist_mask[:, :, :, None] & a_nlist_mask[:, :, None, :]
             # n_angle x 1
@@ -585,6 +587,7 @@ def forward(
             edge_index = torch.zeros([2, 1], device=nlist.device, dtype=nlist.dtype)
             angle_index = torch.zeros([3, 1], device=nlist.device, dtype=nlist.dtype)
             self.additional_output_for_fitting["edge_index"] = None
+        self.additional_output_for_fitting["diff"] = diff
         # get edge and angle embedding
         # nb x nloc x nnei x e_dim [OR] n_edge x e_dim
         if not self.edge_init_use_dist:
diff --git a/deepmd/pt/model/model/__init__.py b/deepmd/pt/model/model/__init__.py
@@ -91,16 +91,16 @@ def _get_standard_model_components(model_params: dict, ntypes: int) -> tuple:
     fitting_net["ntypes"] = descriptor.get_ntypes()
     fitting_net["type_map"] = copy.deepcopy(model_params["type_map"])
     fitting_net["mixed_types"] = descriptor.mixed_types()
-    if fitting_net["type"] in ["dipole", "polar", "ener_readout"]:
+    if fitting_net["type"] in ["dipole", "polar", "ener_readout", "ener_direct"]:
         fitting_net["embedding_width"] = descriptor.get_dim_emb()
     if fitting_net["type"] in ["ener_readout"]:
         fitting_net["norm_fact"] = descriptor.get_norm_fact()
     fitting_net["dim_descrpt"] = descriptor.get_dim_out()
-    grad_force = "direct" not in fitting_net["type"]
-    if not grad_force:
-        fitting_net["out_dim"] = descriptor.get_dim_emb()
-        if "ener" in fitting_net["type"]:
-            fitting_net["return_energy"] = True
+    # grad_force = "direct" not in fitting_net["type"]
+    # if not grad_force:
+    #     fitting_net["out_dim"] = descriptor.get_dim_emb()
+    #     if "ener" in fitting_net["type"]:
+    #         fitting_net["return_energy"] = True
     fitting = BaseFitting(**fitting_net)
     return descriptor, fitting, fitting_net["type"]
 
@@ -267,7 +267,12 @@ def get_standard_model(model_params: dict) -> BaseModel:
         modelcls = PolarModel
     elif fitting_net_type == "dos":
         modelcls = DOSModel
-    elif fitting_net_type in ["ener", "direct_force_ener", "ener_readout"]:
+    elif fitting_net_type in [
+        "ener",
+        "direct_force_ener",
+        "ener_readout",
+        "ener_direct",
+    ]:
         modelcls = EnergyModel
     elif fitting_net_type == "property":
         modelcls = PropertyModel
diff --git a/deepmd/pt/model/model/ener_model.py b/deepmd/pt/model/model/ener_model.py
@@ -120,8 +120,8 @@ def forward(
                     model_predict["atom_virial"] = model_ret["energy_derv_c"].squeeze(
                         -3
                     )
-            else:
-                model_predict["force"] = model_ret["dforce"]
+            if "dforce" in model_ret:
+                model_predict["dforce"] = model_ret["dforce"]
             if "mask" in model_ret:
                 model_predict["mask"] = model_ret["mask"]
             if self._hessian_enabled:
@@ -160,15 +160,16 @@ def forward_lower(
             model_predict["energy"] = model_ret["energy_redu"]
             if self.do_grad_r("energy"):
                 model_predict["extended_force"] = model_ret["energy_derv_r"].squeeze(-2)
+            else:
+                assert model_ret["dforce"] is not None
+                model_predict["dforce"] = model_ret["dforce"]
+
             if self.do_grad_c("energy"):
                 model_predict["virial"] = model_ret["energy_derv_c_redu"].squeeze(-2)
                 if do_atomic_virial:
                     model_predict["extended_virial"] = model_ret[
                         "energy_derv_c"
                     ].squeeze(-3)
-            else:
-                assert model_ret["dforce"] is not None
-                model_predict["dforce"] = model_ret["dforce"]
         else:
             model_predict = model_ret
         return model_predict
diff --git a/deepmd/pt/model/task/ener.py b/deepmd/pt/model/task/ener.py
@@ -422,3 +422,239 @@ def forward(
             # energy
             out = out + edge_energy / self.norm_e_fact
         return {self.var_name: out.to(env.GLOBAL_PT_FLOAT_PRECISION)}
+
+
+@Fitting.register("ener_direct")
+@fitting_check_output
+class EnergyFittingNetDirectHead(InvarFitting):
+    def __init__(
+        self,
+        ntypes: int,
+        dim_descrpt: int,
+        neuron: list[int] = [128, 128, 128],
+        bias_atom_e: Optional[torch.Tensor] = None,
+        resnet_dt: bool = True,
+        numb_fparam: int = 0,
+        numb_aparam: int = 0,
+        dim_case_embd: int = 0,
+        embedding_width: int = 128,
+        activation_function: str = "tanh",
+        precision: str = DEFAULT_PRECISION,
+        mixed_types: bool = True,
+        seed: Optional[Union[int, list[int]]] = None,
+        type_map: Optional[list[str]] = None,
+        additional_gradient: bool = False,
+        additional_noise_head: bool = False,
+        **kwargs: Any,
+    ) -> None:
+        """Construct a fitting net for energy.
+
+        Args:
+        - ntypes: Element count.
+        - embedding_width: Embedding width per atom.
+        - neuron: Number of neurons in each hidden layers of the fitting net.
+        - bias_atom_e: Average energy per atom for each element.
+        - resnet_dt: Using time-step in the ResNet construction.
+        """
+        self.additional_gradient = additional_gradient
+        self.additional_noise_head = additional_noise_head
+        super().__init__(
+            "energy",
+            ntypes,
+            dim_descrpt,
+            1,
+            neuron=neuron,
+            bias_atom_e=bias_atom_e,
+            resnet_dt=resnet_dt,
+            numb_fparam=numb_fparam,
+            numb_aparam=numb_aparam,
+            dim_case_embd=dim_case_embd,
+            activation_function=activation_function,
+            precision=precision,
+            mixed_types=mixed_types,
+            seed=seed,
+            type_map=type_map,
+            **kwargs,
+        )
+
+        # embedding for direct force
+        self.force_input_dim = embedding_width  # can add force embedding if needed
+        self.force_embed = NetworkCollection(
+            1 if not self.mixed_types else 0,
+            self.ntypes,
+            network_type="fitting_network",
+            networks=[
+                FittingNet(
+                    self.force_input_dim,
+                    1,
+                    self.neuron,
+                    self.activation_function,
+                    self.resnet_dt,
+                    self.precision,
+                    bias_out=True,
+                    seed=child_seed(self.seed + 100, ii),
+                )
+                for ii in range(self.ntypes if not self.mixed_types else 1)
+            ],
+        )
+        # additional noise head
+        self.noise_input_dim = embedding_width  # can add noise embedding if needed
+        if self.additional_noise_head:
+            # dforce for force; dnosie for noise
+            self.noise_embed = NetworkCollection(
+                1 if not self.mixed_types else 0,
+                self.ntypes,
+                network_type="fitting_network",
+                networks=[
+                    FittingNet(
+                        self.noise_input_dim,
+                        1,
+                        self.neuron,
+                        self.activation_function,
+                        self.resnet_dt,
+                        self.precision,
+                        bias_out=True,
+                        seed=child_seed(self.seed + 200, ii),
+                    )
+                    for ii in range(self.ntypes if not self.mixed_types else 1)
+                ],
+            )
+        else:
+            # dforce for noise
+            self.noise_embed = None
+
+        # set trainable
+        for param in self.parameters():
+            param.requires_grad = self.trainable
+
+    def output_def(self) -> FittingOutputDef:
+        out_list = [
+            OutputVariableDef(
+                self.var_name,
+                [self.dim_out],
+                reducible=True,
+                r_differentiable=self.additional_gradient,
+                c_differentiable=self.additional_gradient,
+            ),
+            OutputVariableDef(
+                "dforce",
+                [3],
+                reducible=False,
+                r_differentiable=False,
+                c_differentiable=False,
+            ),
+        ]
+        if self.additional_noise_head:
+            out_list.append(
+                OutputVariableDef(
+                    "dnoise",
+                    [3],
+                    reducible=False,
+                    r_differentiable=False,
+                    c_differentiable=False,
+                )
+            )
+
+        return FittingOutputDef(out_list)
+
+    # make jit happy with torch 2.0.0
+    exclude_types: list[int]
+
+    def need_additional_input(self) -> bool:
+        return True
+
+    def serialize(self) -> dict:
+        raise NotImplementedError
+
+    @classmethod
+    def deserialize(cls, data: dict) -> "EnergyFittingNetDirectHead":
+        raise NotImplementedError
+
+    def change_type_map(
+        self, type_map: list[str], model_with_new_type_stat: Optional[Any] = None
+    ) -> None:
+        raise NotImplementedError
+
+    def get_type_map(self) -> list[str]:
+        raise NotImplementedError
+
+    def forward(
+        self,
+        descriptor: torch.Tensor,
+        atype: torch.Tensor,
+        gr: Optional[torch.Tensor] = None,
+        g2: Optional[torch.Tensor] = None,
+        h2: Optional[torch.Tensor] = None,
+        fparam: Optional[torch.Tensor] = None,
+        aparam: Optional[torch.Tensor] = None,
+        diff: Optional[torch.Tensor] = None,
+        edge_index: Optional[torch.Tensor] = None,
+        sw: Optional[torch.Tensor] = None,
+    ) -> dict[str, torch.Tensor]:
+        """Based on embedding net output, alculate total energy.
+
+        Args:
+        - inputs: Embedding matrix. Its shape is [nframes, natoms[0], self.dim_descrpt].
+        - natoms: Tell atom count and element count. Its shape is [2+self.ntypes].
+
+        Returns
+        -------
+        - `torch.Tensor`: Total energy with shape [nframes, natoms[0]].
+        """
+        out = self._forward_common(descriptor, atype, gr, g2, h2, fparam, aparam)[
+            self.var_name
+        ]
+        # energy
+        result = {self.var_name: out.to(env.GLOBAL_PT_FLOAT_PRECISION)}
+
+        # direct force
+        assert diff is not None
+        assert g2 is not None
+
+        nf, nloc, _ = descriptor.shape
+
+        # nf x nloc x nnei x 3 [OR] nedge x 3
+        edge_vec = diff
+        # nf x nloc x nnei x d [OR] nedge x d
+        edge_feature = g2
+        # nf x nloc x nnei x 1 [OR] nedge x 1
+        edge_weight = self.force_embed.networks[0](edge_feature)
+        # nf x nloc x nnei x 3 [OR] nedge x 3
+        fij = edge_weight * edge_vec
+        if edge_index is not None:
+            # use dynamic sel
+            n2e_index, n_ext2e_index = edge_index[:, 0], edge_index[:, 1]
+            # nf x nloc x 3
+            fi = aggregate(
+                fij,
+                n2e_index,
+                average=False,
+                num_owner=nf * nloc,
+            ).reshape(nf, nloc, 3)
+        else:
+            # nf x nloc x 3
+            fi = torch.sum(fij, dim=-2)
+
+        result["dforce"] = fi
+
+        if self.additional_noise_head:
+            assert self.noise_embed is not None
+            edge_weight = self.noise_embed.networks[0](edge_feature)
+            # nf x nloc x nnei x 3 [OR] nedge x 3
+            nij = edge_weight * edge_vec
+            if edge_index is not None:
+                # use dynamic sel
+                n2e_index, n_ext2e_index = edge_index[:, 0], edge_index[:, 1]
+                # nf x nloc x 3
+                ni = aggregate(
+                    nij,
+                    n2e_index,
+                    average=False,
+                    num_owner=nf * nloc,
+                ).reshape(nf, nloc, 3)
+            else:
+                # nf x nloc x 3
+                ni = torch.sum(nij, dim=-2)
+            result["dnoise"] = ni
+
+        return result
diff --git a/deepmd/pt/model/task/invar_fitting.py b/deepmd/pt/model/task/invar_fitting.py
@@ -178,6 +178,7 @@ def forward(
         aparam: Optional[torch.Tensor] = None,
         sw: Optional[torch.Tensor] = None,
         edge_index: Optional[torch.Tensor] = None,
+        diff: Optional[torch.Tensor] = None,
     ) -> dict[str, torch.Tensor]:
         """Based on embedding net output, alculate total energy.
 
diff --git a/deepmd/utils/argcheck.py b/deepmd/utils/argcheck.py

Original file line number	Diff line number	Diff line change
`@@ -286,6 +286,7 @@ def forward_atomic(`
`286`	`286`	`aparam=aparam,`
`287`	`287`	`sw=sw,`
`288`	`288`	`edge_index=add_input.get("edge_index", None),`
	`289`	`+ diff=add_input.get("diff", None),`
`289`	`290`	`)`
`290`	`291`	`if self.enable_eval_fitting_last_layer_hook:`
`291`	`292`	`assert "middle_output" in fit_ret, (`