python模型训练 warm_start_TensorFlow函数：tf.estimator.WarmStartSettings

tf.estimator.WarmStartSettings函数WarmStartSettings类在Estimators中进行warm-starting的设置.示例：使用DNNEstimator罐头emb_vocab_file = tf.feature_column.embedding_column(tf.feature_column.categorical_column_with_voca..

weixin_39644139

1105人浏览 · 2020-12-24 09:17:13

weixin_39644139 · 2020-12-24 09:17:13 发布

tf.estimator.WarmStartSettings函数

WarmStartSettings类

在Estimators中进行warm-starting的设置.

示例：使用 DNNEstimator 罐头emb_vocab_file = tf.feature_column.embedding_column(

tf.feature_column.categorical_column_with_vocabulary_file(

"sc_vocab_file", "new_vocab.txt", vocab_size=100),

dimension=8)

emb_vocab_list = tf.feature_column.embedding_column(

tf.feature_column.categorical_column_with_vocabulary_list(

"sc_vocab_list", vocabulary_list=["a", "b"]),

dimension=8)

estimator = tf.estimator.DNNClassifier(

hidden_units=[128, 64], feature_columns=[emb_vocab_file, emb_vocab_list],

warm_start_from=ws)

其中ws可以定义为：

模型中warm-start的所有权重(输入层和隐藏权重).可以提供目录或特定的检查点(在前者的情况下,将使用最新的检查点)：ws = WarmStartSettings(ckpt_to_initialize_from="/tmp")

ws = WarmStartSettings(ckpt_to_initialize_from="/tmp/model-1000")

仅warm-start启动嵌入(输入层)及其累加器变量：ws = WarmStartSettings(ckpt_to_initialize_from="/tmp",

vars_to_warm_start=".*input_layer.*")

warm-start除优化器累加器变量(DNN默认为Adagrad)之外的所有内容：ws = WarmStartSettings(ckpt_to_initialize_from="/tmp",

vars_to_warm_start="^(?!.*(Adagrad))")

warm-start所有权重,但与sc_vocab_file对应的嵌入参数与当前模型中使用的词汇不同：vocab_info = ws_util.VocabInfo(

new_vocab=sc_vocab_file.vocabulary_file,

new_vocab_size=sc_vocab_file.vocabulary_size,

num_oov_buckets=sc_vocab_file.num_oov_buckets,

old_vocab="old_vocab.txt"

)

ws = WarmStartSettings(

ckpt_to_initialize_from="/tmp",

var_name_to_vocab_info={

"input_layer/sc_vocab_file_embedding/embedding_weights": vocab_info

})

仅warm-start sc_vocab_file嵌入(并且没有其他变量),它们与当前模型中使用的词汇不同：vocab_info = ws_util.VocabInfo(

new_vocab=sc_vocab_file.vocabulary_file,

new_vocab_size=sc_vocab_file.vocabulary_size,

num_oov_buckets=sc_vocab_file.num_oov_buckets,

old_vocab="old_vocab.txt"

)

ws = WarmStartSettings(

ckpt_to_initialize_from="/tmp",

vars_to_warm_start=None,

var_name_to_vocab_info={

"input_layer/sc_vocab_file_embedding/embedding_weights": vocab_info

})

对所有权重进行warm-start,但sc_vocab_file对应的参数与当前检查点中使用的词汇不同,只有100个项被使用：vocab_info = ws_util.VocabInfo(

new_vocab=sc_vocab_file.vocabulary_file,

new_vocab_size=sc_vocab_file.vocabulary_size,

num_oov_buckets=sc_vocab_file.num_oov_buckets,

old_vocab="old_vocab.txt",

old_vocab_size=100

)

ws = WarmStartSettings(

ckpt_to_initialize_from="/tmp",

var_name_to_vocab_info={

"input_layer/sc_vocab_file_embedding/embedding_weights": vocab_info

})

warm-start所有权重,但sc_vocab_file对应的参数与当前检查点中使用的词汇不同,sc_vocab_list对应的参数与当前检查点有不同的名称：vocab_info = ws_util.VocabInfo(

new_vocab=sc_vocab_file.vocabulary_file,

new_vocab_size=sc_vocab_file.vocabulary_size,

num_oov_buckets=sc_vocab_file.num_oov_buckets,

old_vocab="old_vocab.txt",

old_vocab_size=100

)

ws = WarmStartSettings(

ckpt_to_initialize_from="/tmp",

var_name_to_vocab_info={

"input_layer/sc_vocab_file_embedding/embedding_weights": vocab_info

var_name_to_prev_var_name={

"input_layer/sc_vocab_list_embedding/embedding_weights":

"old_tensor_name"

})

属性：

ckpt_to_initialize_from：[必需]一个字符串,用于指定具有检查点文件的目录或检查点的路径,以便从中启动模型参数.

vars_to_warm_start：[可选]一个正则表达式,用于捕获要启动哪个变量.默认为'.*',它会warm-start所有变量.如果None明确给出,只有var_name_to_vocab_info中指定的变量将被warm-start.

var_name_to_vocab_info：[可选]字典变量名称(字符串)的VocabInfo.变量名称应该是“完整的”变量,而不是分区的名称.如果没有明确提供,则假定该变量没有词汇表.

var_name_to_prev_var_name：[可选]将变量名称(字符串)指定为之前ckpt_to_initialize_from中训练的变量的名称.如果未明确提供,则假定变量的名称在前一个检查点和当前模型之间相同.

函数属性

ckpt_to_initialize_from

字段编号0的别名

var_name_to_prev_var_name

字段编号3的别名

var_name_to_vocab_info

字段编号2的别名

vars_to_warm_start

字段编号1的别名

函数方法

__new__@staticmethod

__new__(

cls,

ckpt_to_initialize_from,

vars_to_warm_start='.*',

var_name_to_vocab_info=None,

var_name_to_prev_var_name=None

)

技术共进，成长同行——讯飞AI开发者社区

更多推荐

Python学习——安装配置python环境+入门_python安装

Python 是一种广泛使用的高级编程语言，由 Guido van Rossum 于 1991 年首次发布。它设计的哲学强调代码的可读性、简洁和易用。Python 支持多种编程范式，包括面向对象、结构化编程以及功能编程。这使得 Python 成为数据科学、Web 开发、自动化测试、人工智能等多个领域的首选语言。Python 的语法简单且易学，即使你是编程新手，也能在短时间内掌握并开始编写程序。Py

讯飞AI开发者社区

大数据在物流行业的使用

大数据已经将物流从一个“黑盒”状态转变为一个高度透明、可预测、可优化的智能网络。它不再仅仅是辅助工具，而是成为了现代物流企业的核心竞争力和神经系统。未来的发展趋势将是与物联网、人工智能、区块链等技术更深度的融合，最终实现整个供应链的自适应、自决策和自优化，即“智慧供应链”。

讯飞AI开发者社区

第71篇：AI+能源：智能电网、新能源预测与节能优化

摘要：本文系统性地深入探讨人工智能在能源领域的革命性应用。我们首先解析智能电网（Smart Grid）的核心机制——AI如何融合实时电力数据（发电、输电、配电、用电）、气象信息、用户行为，通过强化学习（Reinforcement Learning）与优化算法（如线性规划、混合整数规划），实现电力的动态调度、供需平衡、故障预测与自愈，构建更安全、高效、弹性的电力系统。