对qwen3-4b大模型采用peft+transformers进行lora微调后得到lora权重,将base模型与lora模型合并后的模型为model1, 当model1进行save_pretrained之后,再重新加载模型得到model2 然后,后续利用相同的数据、推理参数与程序进行推理,并在推理程序中do_sample设置为False。 model1与 ...