iLQR1.cpp

#include<vector>
#include"iLQR1.h"
#include"math.h"
using std::vector;

//输入原有的状态集和控制集，以及计算的k,K,更新新的状态集和控制集，返回值中第一维为新的状态集，第二维为新的控制集
//add backtracking line search parameter
vector<vector<vector<double>>> iLQR::forward_pass(vector<vector<double>> X,vector<vector<double>> U,vector<vector<vector<double>>> k,vector<vector<vector<double>>> K,double alpha) {
 vector<vector<vector<double>>> ans;
 int n = X.size();
 vector<vector<double>> X_new(n,vector<double>(4,0));
 X_new[0] = X[0];
 vector<vector<double>> U_new(n - 1, vector<double>(2,0));
 for (int i = 0; i < n - 1; ++i) {
    //此处写完backward_pass之后还有待调试
  U_new[i] = m.vectorAdd(m.vectorAdd(U[i],m.scaleVec(m.columnToRow(k[i]),alpha)),m.matToVec(m.matrixTranspose(m.matrixMultiply(K[i],m.matrixTranspose(m.vecToMat(m.vectorSubtract(X_new[i],X[i])))))));
  X_new[i + 1] = model.forward_simulate(X_new[i],U_new[i]);
 }
 ans.push_back(X_new);
 ans.push_back(U_new);
 return ans;
}
vector<vector<double>> iLQR::get_X_new(vector<vector<vector<double>>> A) {
 return A[0];
}
vector<vector<double>> iLQR::get_U_new(vector<vector<vector<double>>> A) {
 return A[1];
}
//backward_pass过程,返回值的第一维为k，第二维为K
   
vector<vector<vector<vector<double>>>> iLQR::backward_pass(vector<vector<double>> X,vector<vector<double>> U) {
 int n = U.size(); //Horizon N
 vector<vector<vector<vector<double>>>> ans;
 //调用constraint类直接得到所有的状态偏导
 vector<vector<vector<double>>> l_x = l.get_state_first_derivatives(X);
 vector<vector<vector<double>>> l_xx = l.get_state_second_derivatives(X);
 vector<vector<vector<double>>> l_u = l.get_control_first_derivatives(U);
 vector<vector<vector<double>>> l_uu = l.get_control_second_derivatives(U);
 vector<vector<double>> l_ux(2,vector<double>(4,0));

 //获取model的各个状态量,调用model类的函数
 vector<double> vel = model.get_vel(X);
 vector<double> theta = model.get_theta(X);
 vector<double> acc = model.get_acc(U);
 //调用model类得到dynamic equation的偏导数信息
 vector<vector<vector<double>>> df_dx = model.get_A_matrix(vel,theta,acc);
 vector<vector<vector<double>>> df_du = model.get_B_matrix(theta);
//返回最后一步的Value function的偏导数
 vector<vector<double>> V_x= l_x[n];
 vector<vector<double>> V_xx= l_xx[n];
//为feeforward和feeback term预分配内存
 vector<vector<vector<double>>> k(n,vector<vector<double>>(2,vector<double>(1,0)));
 vector<vector<vector<double>>> K(n,vector<vector<double>>(2,vector<double>(4,0)));
//为Q分配内存
 vector<vector<double>> Q_x(4,vector<double>(1,0));
 vector<vector<double>> Q_u(2,vector<double>(1,0));
 vector<vector<double>> Q_xx(4,vector<double>(4,0));
 vector<vector<double>> Q_uu(2,vector<double>(2,0));
 vector<vector<double>> Q_ux(2,vector<double>(4,0));
 vector<vector<double>> Q_uu_inv(2,vector<double>(2,0));
//从N - 1一直到0计算状态
 for (int i = n - 1; i >= 0; --i) {
  Q_x = m.matrixAdd(l_x[i],m.matrixMultiply(m.matrixTranspose(df_dx[i]),V_x));
  Q_u = m.matrixAdd(l_u[i],m.matrixMultiply(m.matrixTranspose(df_du[i]),V_x));
  Q_xx = m.matrixAdd(l_xx[i],m.matrixMultiply(m.matrixMultiply(m.matrixTranspose(df_dx[i]),V_xx),df_dx[i]));
  Q_ux = m.matrixAdd(l_ux,m.matrixMultiply(m.matrixMultiply(m.matrixTranspose(df_du[i]),V_xx),df_dx[i]));
  Q_uu = m.matrixAdd(l_uu[i],m.matrixMultiply(m.matrixMultiply(m.matrixTranspose(df_du[i]),V_xx),df_du[i]));
  Q_uu_inv = m.matrixInv(Q_uu);
  k[i] = m.changeSign(m.matrixMultiply(Q_uu_inv,Q_u));
  K[i] = m.changeSign(m.matrixMultiply(Q_uu_inv,Q_ux));

  V_x = m.matrixSubtract(Q_x,m.matrixMultiply(m.matrixMultiply(m.matrixTranspose(K[i]),Q_uu),k[i]));
  V_xx = m.matrixSubtract(Q_xx,m.matrixMultiply(m.matrixMultiply(m.matrixTranspose(K[i]),Q_uu),K[i]));
}
 ans.push_back(k);
 ans.push_back(K);
 return ans;

}
vector<vector<vector<double>>> iLQR::get_k(vector<vector<vector<vector<double>>>> A) {
 return A[0];
}
vector<vector<vector<double>>> iLQR::get_K(vector<vector<vector<vector<double>>>> A) {
 return A[1];
}
  
vector<vector<vector<double>>> iLQR::algorithm_ilqr(vector<double> X_0,vector<vector<double>> U,double eps){
  vector<vector<vector<double>>> ans;
  int n = U.size();
  vector<vector<double>> X = model.get_nomial_trajectory(X_0,U);
  vector<vector<double>> X_new(n + 1,vector<double>(4,0));
  vector<vector<double>> U_new(n,vector<double>(2,0));
  while(1) {
   vector<vector<vector<double>>> k = get_k(backward_pass(X,U));
   vector<vector<vector<double>>> K = get_K(backward_pass(X,U));
   double alpha = 1.0;
   while(1) {
     X_new = get_X_new(forward_pass(X,U,k,K,alpha));
     U_new = get_U_new(forward_pass(X,U,k,K,alpha));
     if (l.cost_all(X_new,U_new) <= l.cost_all(X,U)) {
       break;
     } else {
       alpha /= 2;
     }
   }
   if (l.cost_all(X,U) - l.cost_all(X_new,U_new) < eps) {
     break;
   } else {
     X = X_new;
     U = U_new;
   }
  }
  ans.push_back(X_new);
  ans.push_back(U_new);
  return ans;
}