pytorch之scatter_的用法及说明
作者:czg792845236
pytorch scatter_的用法
scatter_(input, dim, index, src)将src中数据根据index中的索引按照dim的方向填进input中
这个函数可以从转换成onehot编码来理解。
看下面代码:
index = torch.tensor([1,2,1,2,0]) torch.zeros(5,3).scatter_(1, index.unsqueeze(1), 1) # tensor([[0., 1., 0.], # [0., 0., 1.], # [0., 1., 0.], # [0., 0., 1.], # [1., 0., 0.]])
简要说明
这段代码的目的就是将李表[1,2,1,2,0]转成one-hot编码的形式。
因为有5个数据,然后数值范围从0~2,所以需要设置3列,所以目标矩阵应该是5x3。
scatter_
中第一个1表示沿着维度1的方向也就是列的方向,第二个参数表示需要填值的索引,第三个参数表示填的值。
比如以输出结果的第一行为例,原本 torch.zeros
使得第一行的元素都是0,但是 scatter_
的第二个输入参数第一行是1(因为经过unsqueeze后第一行只有一个元素了),所以输出结果的第一行的第1个元素(从0开始)应该填上 scatter
最后一个参数所表示的值,剩下的以此类推。
不过其实得到onehot编码可以用pandas.get_dummies
index = [1,2,1,2,0] pd.get_dummies(index)
.scatter_函数
.scatter_函数放置元素或者修改元素。
>>> x = torch.rand(2, 5) >>> x tensor([[0.6132, 0.8931, 0.7345, 0.6793, 0.6606], [0.0630, 0.1785, 0.7312, 0.6456, 0.6307]]) >>> torch.zeros(3, 5).scatter_(0, torch.LongTensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), 1) tensor([[1., 1., 1., 1., 1.], [0., 1., 0., 1., 0.], [1., 0., 1., 0., 1.]]) >>> torch.zeros(3, 5).scatter_(0, torch.LongTensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x) tensor([[0.6132, 0.1785, 0.7312, 0.6793, 0.6606], [0.0000, 0.8931, 0.0000, 0.6456, 0.0000], [0.0630, 0.0000, 0.7345, 0.0000, 0.6307]])
torch.zeros(3,5),先创建一个3行5列的全为0的tensor,后续使用scatter函数往里放置元素,如何放置按照参数1和参数2的规定,放置哪些元素,按照参数3的规定。
具体来说
上述.scatter_(参数1,参数2,参数3)中,参数0/1表示,按行/列进行元素的放置(维度再高类比扩展),参数2用于找索引(找torch.zeros中位置),参数3为希望放入的元素。例如当参数3为x的时候,torch.zeros(3,5)中填入的为x中的元素;当参数3为1的时候,形成的tensor中为1,即表示希望放入的元素为1。
如何放置,先从简单的,放置的元素为1开始:
第一步,先看参数2,找index。
参数2的值是一个tensor:
[[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]
例如,其中第1行第0列(1,0)的值为2,即index=2。
第二步,根据index确定行/列,看参数1。
本例中参数1为0,按行放置,因此在torch.zeros(3,5)的第2行(注意从0开始)填入1,那么,在第2行(从0开始)的哪一列填入1呢,需要遵循的原则是:第一步中index所在位置为第1列,因此放入第1列。因此在torch.zeros(3,5)的(2,1)位置上放入1。
即往torch.zeros(3,5)中填入元素的时候,torch.zeros(3,5)中元素的列与x的列是相同的,这一点当x是具体数值的时候比较清晰。可以看出x的列与torch.zeros(3,5)最后填完之后的列中的元素是对应的,比如第1列的元素不会跑到第2列去,但是行不一定。
那么,复杂一点,如果放置的元素不是1,而是需要把x中的元素放入呢。增加第三步,目前已经找到参数2中 (1,0) 的index是2了,再看参数3,此时参数3为x,在x中找 (1,0) 位置上的元素是0.0630,因此这时候在第二步中,放入第1行第0列的元素不是1,而是0.0630。因此在torch.zeros(3,5)的(2,1)位置上放入0.0630。
Note:
- 第二步中,如果参数=1,表示按行放置,则先确定行再确定列;如果参数=0,表示按列放置,则先确定列再确定行。
- 本例中因为是按行放置,要求torch.zeros(3,5)的列与x的列是相同的,否则没法做到列列对应;如果是按列方式,则要求【被填入的torch】与x的行是相同的,否则没法做到行行对应。
- 参数2中的值控制的是【被填入的torch】的x行或者x列,因此参数2中的最大值,不应该超过【被填入的torch】的行/列(按列排序/按行排序)–>参数2控制位置。
->按行排序,列列对应;按列排序,行行对应。
参数2,参数1,最后再看参数3。
index数值找到确定行/列,再看index位置,确定列/行。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。