nnstreamer · EunjuYang · Nov 29, 2024 · Nov 29, 2024 · myungjoo · Dec 20, 2024
@@ -39,9 +39,11 @@ static void add_default_object(ClContext &cc) {
                        ml::train::LayerType::LAYER_FC);
   }
 
-  cc.registerFactory(nntrainer::createLayer<AdditionLayerCL>,
-                     AdditionLayerCL::type,
-                     ml::train::LayerType::LAYER_ADDITION);
+  if (AdditionLayerCL::registerClKernels()) {
+    cc.registerFactory(nntrainer::createLayer<AdditionLayerCL>,
+                       AdditionLayerCL::type,
+                       ml::train::LayerType::LAYER_ADDITION);
+  }
 
   // @todo swiglulayercl also needs to be updated.
   cc.registerFactory(nntrainer::createLayer<SwiGLULayerCl>, SwiGLULayerCl::type,
@@ -62,10 +64,11 @@ static void add_default_object(ClContext &cc) {
                        ConcatLayerCl::type, ml::train::LayerType::LAYER_CONCAT);
   }
 
-  // @todo transposlayercl also needs to be updated.
-  cc.registerFactory(nntrainer::createLayer<TransposeLayerCl>,
-                     TransposeLayerCl::type,
-                     ml::train::LayerType::LAYER_TRANSPOSE);
+  if (TransposeLayerCl::registerClKernels()) {
+    cc.registerFactory(nntrainer::createLayer<TransposeLayerCl>,
+                       TransposeLayerCl::type,
+                       ml::train::LayerType::LAYER_TRANSPOSE);
+  }
 }
 
 static void registerer(ClContext &cc) noexcept {

@@ -18,19 +18,20 @@
 #include <cl_context.h>
 #include <common_properties.h>
 #include <layer_devel.h>
+#include <layer_impl_cl.h>
 
 namespace nntrainer {
 
 /**
  * @class   AdditionLayerCL
  * @brief   Addition Layer
  */
-class AdditionLayerCL : public Layer {
+class AdditionLayerCL : public LayerImplCl {
 public:
   /**
    * @brief     Constructor of Addition Layer
    */
-  AdditionLayerCL() : Layer(), add_props(props::Print()) {}
+  AdditionLayerCL() : LayerImplCl(), add_props(props::Print()) {}
 
   /**
    * @brief     Destructor of Addition Layer
@@ -93,10 +94,19 @@ class AdditionLayerCL : public Layer {
    */
   const std::string getType() const override { return AdditionLayerCL::type; };
 
-  std::tuple<props::Print>
-    add_props; /**< fc layer properties : unit - number of output neurons */
+  /**
+   * @brief     Register Cl Kernels for `AdditionLayerCl`, bypassing the
+   * registration process since it does not require any specific kernels. This
+   * function simply returns `true` because `AdditionLayerCl` does not rely on
+   * the specific kernels for the layer.
+   */
+  static bool registerClKernels() { return true; };
 
   inline static const std::string type = "addition";
+
+private:
+  std::tuple<props::Print>
+    add_props; /**< fc layer properties : unit - number of output neurons */
 };
 
 } // namespace nntrainer

@@ -16,6 +16,7 @@
 
 #include <common_properties.h>
 #include <layer_devel.h>
+#include <layer_impl_cl.h>
 #include <opencl_buffer.h>
 #include <opencl_kernel.h>
 
@@ -25,13 +26,13 @@ namespace nntrainer {
  * @brief A tranpose layer.
  *
  */
-class TransposeLayerCl final : public Layer {
+class TransposeLayerCl final : public LayerImplCl {
 public:
   /**
    * @brief Construct a new transpose layer object
    *
    */
-  TransposeLayerCl() : Layer(), transpose_props(props::Print()) {}
+  TransposeLayerCl() : LayerImplCl(), transpose_props(props::Print()) {}
 
   /**
    * @brief Destroy the transpose layer object
@@ -82,15 +83,17 @@ class TransposeLayerCl final : public Layer {
    */
   void setProperty(const std::vector<std::string> &values) override;
 
-  inline static const std::string type = "transpose";
+  /**
+   * @brief     Register Cl Kernels for `TransposeLayerCl`, bypassing the
+   * registration process since it does not require any specific kernels. This
+   * function simply returns `true` because `TransposeLayerCl` does not rely on
+   * the specific kernels for the layer.
+   */
+  static bool registerClKernels() { return true; };
 
-  static opencl::Kernel kernel_transpose_axis0;
-  static opencl::Kernel kernel_transpose_fp16_axis0;
-  static opencl::Kernel kernel_transpose_axis1;
-  static opencl::Kernel kernel_transpose_fp16_axis1;
-  static opencl::Kernel kernel_transpose_axis2;
-  static opencl::Kernel kernel_transpose_fp16_axis2;
+  inline static const std::string type = "transpose";
 
+private:
   std::tuple<props::Print> transpose_props; /**< transpose layer properties :
                                             unit - number of output neurons */
 };