评估
评估命令
torchrun --master_addr=localhost --master_port=32555 \
--nnodes=1 --nproc-per-node=2 --node_rank=0 \
-m tzrec.eval \
--pipeline_config_path experiments/multi_tower_din_taobao_local/pipeline.config \
--eval_input_path data/taobao_data_eval/\*.parquet
–pipeline_config_path: 评估用的配置文件
–checkpoint_path: 指定要评估的checkpoint, 默认评估model_dir下面最新的checkpoint
–eval_input_path: 评估数据的输入路径
–eval_result_filename: 评估指标的结果文件名
环境变量
评估配置
评估配置是指配置文件中的eval_config,详细参考配置参考手册
eval_config {
}
num_steps: 评估的步数,默认为评估eval_input_path中指定的所有数据
log_step_count_steps: 评估打印log和summary的步数间隔(如果打印时间间隔小于1s,会跳过打印)