2022实践空间站问题汇总2 #737

zzzkey23 · 2022-06-02T12:26:00Z

1.没有GPU的情况能不能进行这个项目？Azure for Student的100$ / 年，如果在Azure开带GPU的VM好像不到24h就花光了，希望能用纯CPU的vm完成。
2.项目二里的，这个input.data<scalar_t>()是怎样一种数据结构？为什么要把blockIdx平方？举例一个例子，这个Linear层输入是32维输出也是32维，那就是32个Cell，假设Batch是10，那么M = size(0) = 10, N = size(1) = 32，weight.size(1) = ?，blockIdx和threadIdx的遍历范围是多大

？

UEFI-code · 2022-06-03T08:47:17Z

我想修改一下问题，在上述举的例子中，M = input.size(0) = 10, K = input.size(1) = 32, N = weights.size(0) = ? weights向量的第0维度是否表示神经元的数量，第1维度是否表示每个神经元的权重信息? 使用grid和block的作用是什么? 既然GPU能够并行处理，为什么不1个Thread模拟一个神经元，然后通过block等效循环去遍历每个batch？