stan-dev
diff --git a/‎make/cpplint‎
Lines changed: 2 additions & 1 deletion b/‎make/cpplint‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎makefile‎
Lines changed: 9 additions & 3 deletions b/‎makefile‎
Lines changed: 9 additions & 3 deletions
diff --git a/‎stan/math/opencl/prim/bernoulli_logit_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions b/‎stan/math/opencl/prim/bernoulli_logit_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions
diff --git a/‎stan/math/opencl/prim/categorical_logit_glm_lpmf.hpp‎
Lines changed: 4 additions & 2 deletions b/‎stan/math/opencl/prim/categorical_logit_glm_lpmf.hpp‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎stan/math/opencl/prim/multi_normal_cholesky_lpdf.hpp‎
Lines changed: 2 additions & 4 deletions b/‎stan/math/opencl/prim/multi_normal_cholesky_lpdf.hpp‎
Lines changed: 2 additions & 4 deletions
diff --git a/‎stan/math/opencl/prim/neg_binomial_2_log_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions b/‎stan/math/opencl/prim/neg_binomial_2_log_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions
diff --git a/‎stan/math/opencl/prim/normal_id_glm_lpdf.hpp‎
Lines changed: 4 additions & 5 deletions b/‎stan/math/opencl/prim/normal_id_glm_lpdf.hpp‎
Lines changed: 4 additions & 5 deletions
diff --git a/‎stan/math/opencl/prim/ordered_logistic_glm_lpmf.hpp‎
Lines changed: 2 additions & 2 deletions b/‎stan/math/opencl/prim/ordered_logistic_glm_lpmf.hpp‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎stan/math/opencl/prim/poisson_log_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions b/‎stan/math/opencl/prim/poisson_log_glm_lpmf.hpp‎
Lines changed: 4 additions & 5 deletions
diff --git a/‎stan/math/opencl/rev/operands_and_partials.hpp‎
Lines changed: 6 additions & 12 deletions b/‎stan/math/opencl/rev/operands_and_partials.hpp‎
Lines changed: 6 additions & 12 deletions
@@ -2,4 +2,5 @@ PYTHON ?= python
 
 .PHONY: cpplint
 cpplint:
-	@$(PYTHON) $(CPPLINT)/cpplint.py --output=vs7 --counting=detailed --root=stan --extension=hpp,cpp --filter=-runtime/indentation_namespace,-build/c++11,-readability/namespace,-legal/copyright,-whitespace/indent,-runtime/reference,-build/header_guard,-build/include_order,-build/include_what_you_use,-runtime/string,-build/namespaces $(shell (find test/unit -name '*.hpp' -o -name '*.cpp') && (find stan -name '*.hpp' -o -name '*.cpp'))
+	@$(PYTHON) $(CPPLINT)/cpplint.py --output=vs7 --counting=detailed --root=stan --extension=hpp,cpp --filter=-runtime/indentation_namespace,-build/c++11,-readability/namespace,-legal/copyright,-whitespace/indent,-runtime/reference,-build/header_guard,-build/include_order,-build/include_what_you_use,-runtime/string,-build/namespaces $(shell (find stan -name '*.hpp' -o -name '*.cpp'))
+	@$(PYTHON) $(CPPLINT)/cpplint.py --output=vs7 --counting=detailed --root=stan --extension=hpp,cpp --filter=-runtime/indentation_namespace,-build/c++11,-readability/namespace,-legal/copyright,-whitespace/indent,-runtime/reference,-build/header_guard,-build/include_order,-build/include_what_you_use,-runtime/string,-build/namespaces $(shell (find test/unit -name '*.hpp' -o -name '*.cpp'))
@@ -95,16 +95,22 @@ doxygen:
 ##
 .PHONY: clean clean-doxygen clean-deps clean-all
 clean:
+	@echo '  removing generated test files'
+	@$(RM) $(wildcard test/prob/generate_tests$(EXE))
+	@$(RM) $(call findfiles,test/prob,*_generated_v_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_vv_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_fd_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_fv_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_ffd_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_ffv_test.cpp)
+	@$(RM) $(call findfiles,test/prob,*_generated_*_test.cpp)
 	@echo '  removing test executables'
 	@$(RM) $(call findfiles,test,*_test$(EXE))
 	@$(RM) $(call findfiles,test,*_test.d)
 	@$(RM) $(call findfiles,test,*_test.d.*)
 	@$(RM) $(call findfiles,test,*_test.xml)
 	@$(RM) $(call findfiles,test,*.o)
 	@$(RM) $(wildcard $(GTEST)/src/gtest-all.o)
-	@echo '  removing generated test files'
-	@$(RM) $(wildcard test/prob/generate_tests$(EXE))
-	@$(RM) $(call findfiles,test/prob,*_generated_*_test.cpp)
 	@$(RM) $(TEST_STANC)
 
 clean-doxygen:
 
@@ -152,14 +152,13 @@ return_type_t<T_x_cl, T_alpha_cl, T_beta_cl> bernoulli_logit_glm_lpmf(
     // transposition of a vector can be done without copying
     const matrix_cl<double> theta_derivative_transpose_cl(
         theta_derivative_cl.buffer(), 1, theta_derivative_cl.rows());
-    matrix_cl<double>& edge3_partials
-        = forward_as<matrix_cl<double>&>(ops_partials.edge3_.partials_);
     matrix_cl<double> edge3_partials_transpose_cl
         = theta_derivative_transpose_cl * x_val;
-    edge3_partials = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
-                                       edge3_partials_transpose_cl.cols(), 1);
+    ops_partials.edge3_.partials_
+        = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
+                            edge3_partials_transpose_cl.cols(), 1);
     if (beta_val.rows() != 0) {
-      edge3_partials.add_write_event(
+      ops_partials.edge3_.partials_.add_write_event(
           edge3_partials_transpose_cl.write_events().back());
     }
   }
 
@@ -3,6 +3,7 @@
 #ifdef STAN_OPENCL
 
 #include <stan/math/opencl/prim/size.hpp>
+#include <stan/math/opencl/rev/arena_matrix_cl.hpp>
 #include <stan/math/opencl/rev/operands_and_partials.hpp>
 #include <stan/math/opencl/matrix_cl.hpp>
 #include <stan/math/opencl/copy.hpp>
@@ -150,8 +151,9 @@ return_type_t<T_x, T_alpha, T_beta> categorical_logit_glm_lpmf(
     try {
       opencl_kernels::categorical_logit_glm_beta_derivative(
           cl::NDRange(local_size * N_attributes), cl::NDRange(local_size),
-          forward_as<matrix_cl<double>>(ops_partials.edge3_.partials_), temp,
-          y_val_cl, x_val, N_instances, N_attributes, N_classes, is_y_vector);
+          forward_as<arena_matrix_cl<double>>(ops_partials.edge3_.partials_),
+          temp, y_val_cl, x_val, N_instances, N_attributes, N_classes,
+          is_y_vector);
     } catch (const cl::Error& e) {
       check_opencl_error(function, e);
     }
 
@@ -120,16 +120,14 @@ inline return_type_t<T_y_cl, T_loc_cl, T_covar_cl> multi_normal_cholesky_lpdf(
 
   if (!is_constant_all<T_y_cl>::value) {
     if (y_val.cols() == 1) {
-      forward_as<matrix_cl<double>>(ops_partials.edge1_.partials_)
-          = -rowwise_sum(scaled_diff);
+      ops_partials.edge1_.partials_ = -rowwise_sum(scaled_diff);
     } else {
       ops_partials.edge1_.partials_ = -scaled_diff;
     }
   }
   if (!is_constant_all<T_loc_cl>::value) {
     if (mu_val.cols() == 1) {
-      forward_as<matrix_cl<double>>(ops_partials.edge2_.partials_)
-          = rowwise_sum(scaled_diff);
+      ops_partials.edge2_.partials_ = rowwise_sum(scaled_diff);
     } else {
       ops_partials.edge2_.partials_ = scaled_diff;
     }
 
@@ -188,14 +188,13 @@ neg_binomial_2_log_glm_lpmf(const T_y_cl& y, const T_x_cl& x,
     // transposition of a vector can be done without copying
     const matrix_cl<double> theta_derivative_transpose_cl(
         theta_derivative_cl.buffer(), 1, theta_derivative_cl.rows());
-    matrix_cl<double>& edge3_partials
-        = forward_as<matrix_cl<double>&>(ops_partials.edge3_.partials_);
     matrix_cl<double> edge3_partials_transpose_cl
         = theta_derivative_transpose_cl * x_val;
-    edge3_partials = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
-                                       edge3_partials_transpose_cl.cols(), 1);
+    ops_partials.edge3_.partials_
+        = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
+                            edge3_partials_transpose_cl.cols(), 1);
     if (beta_val.rows() != 0) {
-      edge3_partials.add_write_event(
+      ops_partials.edge3_.partials_.add_write_event(
           edge3_partials_transpose_cl.write_events().back());
     }
   }
 
@@ -171,14 +171,13 @@ normal_id_glm_lpdf(const T_y_cl& y, const T_x_cl& x, const T_alpha_cl& alpha,
     // transposition of a vector can be done without copying
     const matrix_cl<double> mu_derivative_transpose_cl(
         mu_derivative_cl.buffer(), 1, mu_derivative_cl.rows());
-    matrix_cl<double>& edge4_partials
-        = forward_as<matrix_cl<double>&>(ops_partials.edge4_.partials_);
     matrix_cl<double> edge4_partials_transpose_cl
         = mu_derivative_transpose_cl * x_val;
-    edge4_partials = matrix_cl<double>(edge4_partials_transpose_cl.buffer(),
-                                       edge4_partials_transpose_cl.cols(), 1);
+    ops_partials.edge4_.partials_
+        = matrix_cl<double>(edge4_partials_transpose_cl.buffer(),
+                            edge4_partials_transpose_cl.cols(), 1);
     if (beta_val.rows() != 0) {
-      edge4_partials.add_write_event(
+      ops_partials.edge4_.partials_.add_write_event(
           edge4_partials_transpose_cl.write_events().back());
     }
   }
 
@@ -140,8 +140,8 @@ return_type_t<T_x, T_beta, T_cuts> ordered_logistic_glm_lpmf(
         edge2_partials_transpose.buffer(), edge2_partials_transpose.cols(),
         edge2_partials_transpose.rows());
     if (beta.rows() != 0) {
-      forward_as<matrix_cl<double>>(ops_partials.edge2_.partials_)
-          .add_write_event(edge2_partials_transpose.write_events().back());
+      ops_partials.edge2_.partials_.add_write_event(
+          edge2_partials_transpose.write_events().back());
     }
   }
   if (!is_constant_all<T_cuts>::value) {
 
@@ -141,14 +141,13 @@ return_type_t<T_x_cl, T_alpha_cl, T_beta_cl> poisson_log_glm_lpmf(
     // transposition of a vector can be done without copying
     const matrix_cl<double> theta_derivative_transpose_cl(
         theta_derivative_cl.buffer(), 1, theta_derivative_cl.rows());
-    matrix_cl<double>& edge3_partials
-        = forward_as<matrix_cl<double>&>(ops_partials.edge3_.partials_);
     matrix_cl<double> edge3_partials_transpose_cl
         = theta_derivative_transpose_cl * x_val;
-    edge3_partials = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
-                                       edge3_partials_transpose_cl.cols(), 1);
+    ops_partials.edge3_.partials_
+        = matrix_cl<double>(edge3_partials_transpose_cl.buffer(),
+                            edge3_partials_transpose_cl.cols(), 1);
     if (beta_val.rows() != 0) {
-      edge3_partials.add_write_event(
+      ops_partials.edge3_.partials_.add_write_event(
           edge3_partials_transpose_cl.write_events().back());
     }
   }
 
@@ -5,6 +5,7 @@
 #include <stan/math/prim/functor/operands_and_partials.hpp>
 #include <stan/math/prim/meta.hpp>
 #include <stan/math/rev/core/var.hpp>
+#include <stan/math/opencl/rev/arena_matrix_cl.hpp>
 #include <stan/math/opencl/kernel_generator.hpp>
 #include <stan/math/opencl/rev/arena_type.hpp>
 #include <stan/math/opencl/rev/to_arena.hpp>
@@ -17,7 +18,7 @@ template <typename Op>
 class ops_partials_edge<double, var_value<Op>,
                         require_kernel_expression_lhs_t<Op>> {
  public:
-  using partials_t = plain_type_t<Op>;
+  using partials_t = arena_matrix_cl<value_type_t<Op>>;
   partials_t partials_;                       // For univariate use-cases
   broadcast_array<partials_t> partials_vec_;  // For multivariate
   explicit ops_partials_edge(const var_value<Op>& ops)
@@ -28,17 +29,10 @@ class ops_partials_edge<double, var_value<Op>,
  private:
   template <typename, typename, typename, typename, typename, typename>
   friend class stan::math::operands_and_partials;
-  const var_value<Op>& operands_;
-
-  void dump_operands(vari** varis) {}
-  void dump_partials(double* partials) {}
-  int size() { return 0; }
-  std::tuple<var_value<Op>> container_operands() {
-    return std::make_tuple(operands_);
-  }
-  std::tuple<partials_t> container_partials() {
-    return std::make_tuple(partials_);
-  }
+  var_value<Op> operands_;
+  static constexpr int size() noexcept { return 0; }
+  inline auto& operand() noexcept { return this->operands_; }
+  inline auto& partial() noexcept { return this->partials_; }
 };
 
 }  // namespace internal
Original file line number	Diff line number	Diff line change
`@@ -120,16 +120,14 @@ inline return_type_t<T_y_cl, T_loc_cl, T_covar_cl> multi_normal_cholesky_lpdf(`
`120`	`120`
`121`	`121`	`if (!is_constant_all<T_y_cl>::value) {`
`122`	`122`	`if (y_val.cols() == 1) {`
`123`		`- forward_as<matrix_cl<double>>(ops_partials.edge1_.partials_)`
`124`		`- = -rowwise_sum(scaled_diff);`
	`123`	`+ ops_partials.edge1_.partials_ = -rowwise_sum(scaled_diff);`
`125`	`124`	`} else {`
`126`	`125`	`ops_partials.edge1_.partials_ = -scaled_diff;`
`127`	`126`	`}`
`128`	`127`	`}`
`129`	`128`	`if (!is_constant_all<T_loc_cl>::value) {`
`130`	`129`	`if (mu_val.cols() == 1) {`
`131`		`- forward_as<matrix_cl<double>>(ops_partials.edge2_.partials_)`
`132`		`- = rowwise_sum(scaled_diff);`
	`130`	`+ ops_partials.edge2_.partials_ = rowwise_sum(scaled_diff);`
`133`	`131`	`} else {`
`134`	`132`	`ops_partials.edge2_.partials_ = scaled_diff;`
`135`	`133`	`}`
Original file line number	Diff line number	Diff line change
`@@ -140,8 +140,8 @@ return_type_t<T_x, T_beta, T_cuts> ordered_logistic_glm_lpmf(`
`140`	`140`	`edge2_partials_transpose.buffer(), edge2_partials_transpose.cols(),`
`141`	`141`	`edge2_partials_transpose.rows());`
`142`	`142`	`if (beta.rows() != 0) {`
`143`		`- forward_as<matrix_cl<double>>(ops_partials.edge2_.partials_)`
`144`		`- .add_write_event(edge2_partials_transpose.write_events().back());`
	`143`	`+ ops_partials.edge2_.partials_.add_write_event(`
	`144`	`+ edge2_partials_transpose.write_events().back());`
`145`	`145`	`}`
`146`	`146`	`}`
`147`	`147`	`if (!is_constant_all<T_cuts>::value) {`