pytorch cuda上tensor的定义 以及 减少cpu操作的方法