keras.layers.Layer中无法定义name的问题及解决
作者:唐僧爱吃唐僧肉
keras.layers.Layer中无法定义name问题
在使用keras之中定义层的时候,如果按照以下的方法直接在keras.layers.Layer中定义相应的self.name
会发生相应的报错
import params as pp import params_flow as pf import tensorflow as tf import tensorflow.keras as keras class MyParams(tf.keras.layers.Layer): def __init__(self): super(MyParams,self).__init__() self.name = 'hello' def build(self,input_shape): self.dense0 = keras.layers.Dense(units = 25, #kernel_initializer = self.create_initializer(), name = "dense0") def call(self,inputs): results = self.dense0(inputs) data = MyParams() print(data.name)
此时会相应的报错
AttributeError: Can't set the attribute "name", likely because it conflicts with an existing read-only @property of the object. Please choose a different name.
也就是说,在keras之中的"self.name"为只读属性,不能够被定义,此时需要更换另外一个名字。
但是只有name这个属性能够对应到self.weights的名称之中,那么这里我们该如何定义呢
此时我发现,直接定义在__init__函数之前,可以对keras的名称完成相应的定义
import params as pp import params_flow as pf import tensorflow as tf import tensorflow.keras as keras class MyParams(tf.keras.layers.Layer): name = 'hello' def __init__(self): super(MyParams,self).__init__() def build(self,input_shape): self.dense0 = keras.layers.Dense(units = 25, #kernel_initializer = self.create_initializer(), name = "dense0") def call(self,inputs): results = self.dense0(inputs) data = MyParams() print(data.name)
同时我们传入一个tensor的input_ids类型进行相应的输入,发现已经能够对weights的权重名称进行改变了
input_ids = keras.layers.Input(shape=(50,), dtype='int32', name="input_ids") outputs = data(input_ids) data.weights
对应的输出内容如下
[<tf.Variable 'hello/dense0/kernel:0' shape=(50, 25) dtype=float32, numpy=
array([[-0.10505645, 0.09756875, 0.14427656, ..., -0.17254017,
-0.18592533, -0.13920134],
[-0.10033116, -0.17831415, -0.03435555, ..., -0.02460951,
0.13194972, 0.21918347],
[ 0.15699485, -0.24836 , 0.01044622, ..., 0.04577217,
0.23334488, 0.09155059],
...,
[-0.22210473, 0.14221036, 0.07721925, ..., 0.03358698,
0.08100349, 0.15415356],
[-0.1433322 , -0.00878078, -0.0760702 , ..., -0.06091703,
0.18796855, -0.19009456],
[-0.0446853 , 0.14639893, 0.1729418 , ..., -0.04699725,
0.12940568, -0.24003454]], dtype=float32)>,
<tf.Variable 'hello/dense0/bias:0' shape=(25,) dtype=float32, numpy=
array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0., 0., 0., 0., 0.], dtype=float32)>]
可以发现这里的权重内容已经变成hello打头的内容了,然而此时又一个对应的问题出现了,这得益于__init__函数前面内容的特殊性:
如果我们将对应的内容改为如下
import params as pp import params_flow as pf import tensorflow as tf import tensorflow.keras as keras class MyParams(tf.keras.layers.Layer): print('begining') name = 'hello' def __init__(self): super(MyParams,self).__init__() def build(self,input_shape): self.dense0 = keras.layers.Dense(units = 25, #kernel_initializer = self.create_initializer(), name = "dense0") def call(self,inputs): results = self.dense0(inputs) data = MyParams() print(data.name)
此时运行的时候会运行一次print(‘begining’),输出对应的begining的内容,
也就是说__init__函数之前的内容会在定义MyParams这个类的时候就调用,而MyParams这个类只会被定义一次,也就是说__init__函数之前的内容只会被调用一次。
这样就带来了一个问题,也就是name = 'hello’这里的name没有办法修改,也就是说我们需要想一种办法将__init__函数前面的name='hello’修改一次,这里究竟该如何修改呢?
此时我们只需要在定义之后每次使用的时候重新对name的值进行定义即可
具体的例子如下
import tensorflow as tf import tensorflow.keras as keras class MyParams(tf.keras.layers.Layer): #print('begining') name = 'hello' def __init__(self): super(MyParams,self).__init__() def build(self,input_shape): self.dense0 = keras.layers.Dense(units = 25, #kernel_initializer = self.create_initializer(), name = "dense0") def call(self,inputs): results = self.dense0(inputs) data = MyParams() print(data.name) data.name = 'hello10000' print(data.name)
输出的内容为
进一步查看一下对应的weight的属性
可以看出这里weights之中的属性名称已经成功地被我们定义了
总结
由于name的属性的特殊性,如果在__init__函数之中直接定义可读变量会造成报错,此时我们需要调整思路,通过__init__函数之前定义name变量实现对于name的修改
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。