put intercept in np array

ibayer · AlexJoz · Nov 30, 2017 · Nov 30, 2017 · Nov 30, 2017 · Nov 30, 2017
commit c9daed86fc9b269989cd1fb151afc4a8b709292f
diff --git a/fastFM/als.py b/fastFM/als.py
@@ -91,6 +91,7 @@ def fit(self, X_train, y_train, n_more_iter=0):
             self.warm_start = True
 
         self.w0_, self.w_, self.V_ = ffm.ffm_als_fit(self, X_train, y_train)
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
 
         if self.iter_count != 0:
             self.iter_count = self.iter_count + n_more_iter
@@ -188,4 +189,5 @@ def fit(self, X_train, y_train):
         y_train[~i_class1] = 1
 
         self.w0_, self.w_, self.V_ = ffm.ffm_als_fit(self, X_train, y_train)
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         return self
diff --git a/fastFM/bpr.py b/fastFM/bpr.py
@@ -92,4 +92,5 @@ def fit(self, X, pairs):
         assert pairs.max() <= X.shape[1]
         assert pairs.min() >= 0
         self.w0_, self.w_, self.V_ = ffm.ffm_fit_sgd_bpr(self, X, pairs)
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         return self
diff --git a/fastFM/ffm2.pyx b/fastFM/ffm2.pyx
@@ -14,13 +14,26 @@ cimport numpy as np
 import numpy as np
 
 
-cdef Model* _model_factory(double* w_0, double[:] w,
+cdef Settings* _settings_factory(fm):
+    settings_dict = fm.get_params()
+    cdef Settings* s = new Settings(json.dumps(settings_dict).encode())
+    return s
+
+
+def _init_parameter(fm, n_features):
+    fm.w0_ = np.zeros(1, dtype=np.float64)
+    fm.w_ = np.zeros(n_features, dtype=np.float64)
+    fm.V_ = np.zeros((fm.rank, n_features), dtype=np.float64)
+    return fm.w0_, fm.w_, fm.V_
+
+
+cdef Model* _model_factory(double[:] w_0, double[:] w,
         np.ndarray[np.float64_t, ndim = 2] V):
 
     cdef Model *m = new Model()
     rank = V.shape[0]
     n_features = V.shape[1]
-    m.add_parameter(w_0)
+    m.add_parameter(&w_0[0])
     m.add_parameter(&w[0], n_features)
     m.add_parameter(<double *> V.data, rank, n_features, 2)
 
@@ -30,19 +43,14 @@ cdef Model* _model_factory(double* w_0, double[:] w,
 cdef Model* _model_factory_self(fm):
 
     n_features = fm.w_.shape[0]
-    cdef double w_0
-    cdef np.ndarray[np.float64_t, ndim=1, mode='c'] w
-    cdef np.ndarray[np.float64_t, ndim=2, mode='c'] V
-
-    w_0 = 0 if fm.ignore_w_0 else fm.w0_
-    w = np.zeros(n_features, dtype=np.float64) if fm.ignore_w else fm.w_
-    V = np.zeros((fm.rank, n_features), dtype=np.float64)\
-            if fm.rank == 0 else fm.V_
+    cdef np.ndarray[np.float64_t, ndim=1, mode='c'] w_0 = fm.w0_
+    cdef np.ndarray[np.float64_t, ndim=1, mode='c'] w = fm.w_
+    cdef np.ndarray[np.float64_t, ndim=2, mode='c'] V = fm.V_
 
     cdef Model *m = new Model()
     rank = V.shape[0]
     n_features = V.shape[1]
-    m.add_parameter(&w_0)
+    m.add_parameter(&w_0[0])
     m.add_parameter(&w[0], n_features)
     m.add_parameter(<double *> V.data, rank, n_features, 2)
 
@@ -76,7 +84,7 @@ cdef Data* _data_factory_fit(X, double[:] y_pred,  double[:] y_true):
     return d
 
 
-def ffm_predict(double w_0, double[:] w,
+def ffm_predict(double [:] w_0, double[:] w,
                 np.ndarray[np.float64_t, ndim = 2] V, X):
     assert X.shape[1] == len(w)
     assert X.shape[1] == V.shape[1]
@@ -85,7 +93,7 @@ def ffm_predict(double w_0, double[:] w,
     cdef np.ndarray[np.float64_t, ndim=1, mode='c'] y =\
          np.zeros(X.shape[0], dtype=np.float64)
 
-    m = _model_factory(&w_0, w, V)
+    m = _model_factory(w_0, w, V)
     d = _data_factory(X, y)
 
     cpp_ffm.predict(m, d)
@@ -97,34 +105,44 @@ def ffm_predict(double w_0, double[:] w,
 
 
 def ffm_predict_self(fm, X):
-    # allocate memory for predictions
-    cdef np.ndarray[np.float64_t, ndim=1, mode='c'] y =\
-         np.zeros(X.shape[0], dtype=np.float64)
+    return ffm_predict(fm.w0_, fm.w_, fm.V_, X)
 
-    m = _model_factory_self(fm)
-    d = _data_factory(X, y)
 
-    cpp_ffm.predict(m, d)
+def ffm_fit(double [:] w_0, double[:] w, np.ndarray[np.float64_t, ndim = 2] V,
+                X, double[:] y, int rank, dict settings):
+    assert isinstance(settings, dict)
+    assert X.shape[0] == len(y) # test shapes
+
+    cdef Settings* s = new Settings(json.dumps(settings).encode())
+    m = _model_factory(w_0, w, V)
+
+    # allocate memory for prediction
+    cdef np.ndarray[np.float64_t, ndim=1, mode='c'] y_pred = np.zeros(
+            X.shape[0], dtype=np.float64)
+
+    d = _data_factory_fit(X, y, y_pred)
+
+    cpp_ffm.fit(s, m, d)
 
-    del m
     del d
+    del m
+    del s
 
-    return y
+    return w_0, w, V
 
 
-def ffm_fit(double w_0, double[:] w, np.ndarray[np.float64_t, ndim = 2] V,
-                X, double[:] y, int rank, dict settings):
-    assert isinstance(settings, dict)
+def ffm_fit_self(fm, X, double[:] y):
     assert X.shape[0] == len(y) # test shapes
 
-    cdef Settings* s = new Settings(json.dumps(settings).encode())
-    m = _model_factory(&w_0, w, V)
+    _init_parameter(fm, X.shape[1])
+    m = _model_factory(fm.w0_, fm.w_, fm.V_)
 
     # allocate memory for prediction
     cdef np.ndarray[np.float64_t, ndim=1, mode='c'] y_pred = np.zeros(
             X.shape[0], dtype=np.float64)
 
     d = _data_factory_fit(X, y, y_pred)
+    s = _settings_factory(fm)
 
     cpp_ffm.fit(s, m, d)
 
@@ -133,4 +151,4 @@ def ffm_fit(double w_0, double[:] w, np.ndarray[np.float64_t, ndim = 2] V,
     del m
     del s
 
-    return w_0, w, V
+    return fm.w0_, fm.w_, fm.V_
diff --git a/fastFM/mcmc.py b/fastFM/mcmc.py
@@ -122,6 +122,7 @@ def fit_predict(self, X_train, y_train, X_test, n_more_iter=0):
         coef, y_pred = ffm.ffm_mcmc_fit_predict(self, X_train,
                                                 X_test, y_train)
         self.w0_, self.w_, self.V_ = coef
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         self.prediction_ = y_pred
         self.warm_start = False
 
@@ -231,4 +232,5 @@ def fit_predict_proba(self, X_train, y_train, X_test):
         coef, y_pred = ffm.ffm_mcmc_fit_predict(self, X_train,
                                                 X_test, y_train)
         self.w0_, self.w_, self.V_ = coef
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         return y_pred
diff --git a/fastFM/sgd.py b/fastFM/sgd.py
@@ -91,6 +91,7 @@ def fit(self, X, y):
         X = check_array(X, accept_sparse="csc", dtype=np.float64)
 
         self.w0_, self.w_, self.V_ = ffm.ffm_sgd_fit(self, X, y)
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         return self
 
 
@@ -188,4 +189,5 @@ def fit(self, X, y):
         X = check_array(X, accept_sparse="csc", dtype=np.float64)
 
         self.w0_, self.w_, self.V_ = ffm.ffm_sgd_fit(self, X, y)
+        self.w0_ = np.array([self.w0_], dtype=np.float64)
         return self
diff --git a/fastFM/tests/test_als.py b/fastFM/tests/test_als.py
@@ -21,7 +21,7 @@ def get_test_problem(task='regression'):
     V = np.array([[6, 0],
                   [5, 8]], dtype=np.float64)
     w = np.array([9, 2], dtype=np.float64)
-    w0 = 2
+    w0 = np.array([2], dtype=np.float64)
     if task == 'classification':
         y_labels = np.ones_like(y)
         y_labels[y < np.median(y)] = -1

diff --git a/fastFM/tests/test_ffm.py b/fastFM/tests/test_ffm.py
@@ -19,7 +19,7 @@ def get_test_problem():
     V = np.array([[6, 0],
                   [5, 8]], dtype=np.float64)
     w = np.array([9, 2], dtype=np.float64)
-    w0 = 2
+    w0 = np.array([2], dtype=np.float64)
     return w0, w, V, y, X
 
 def test_ffm_predict():
@@ -37,11 +37,11 @@ def test_ffm2_predict_w0():
     w[:] = 0
     V[:, :] = 0
     y_pred = ffm2.ffm_predict(w0, w, V, X)
-    assert_equal(y_pred, w0)
+    assert_equal(y_pred[0], w0)
 
 def test_ffm2_fit_als():
     w0, w, V, y, X = get_test_problem()
-    w0 = 0
+    w0[:] = 0
     w[:] = 0
     np.random.seed(123)
     V = np.random.normal(loc=0.0, scale=1.0,
@@ -68,7 +68,7 @@ def test_ffm2_fit_als():
 
 def test_ffm2_fit_sgd():
     w0, w, V, y, X = get_test_problem()
-    w0 = 0
+    w0[:] = 0
     w[:] = 0
     np.random.seed(123)
     V = np.random.normal(loc=0.0, scale=1.0,

diff --git a/fastFM/tests/test_sgd.py b/fastFM/tests/test_sgd.py
@@ -21,7 +21,7 @@ def get_test_problem(task='regression'):
     V = np.array([[6, 0],
                   [5, 8]], dtype=np.float64)
     w = np.array([9, 2], dtype=np.float64)
-    w0 = 2
+    w0 = np.array([2], dtype=np.float64)
     if task == 'classification':
         y_labels = np.ones_like(y)
         y_labels[y < np.median(y)] = -1