some bugs when enable LLama2-7b with PaddleNLP

1. 分布式环境的初始化
![Image](https://github.com/user-attachments/assets/b4f8b065-9b52-434b-9d8d-7110c5dbdad3)
2.  AutoTokenizer的选择和get_pad_id的返回
![Image](https://github.com/user-attachments/assets/9e29322f-723f-40c9-a91b-fc9346aa3006)
3. worker最好添加一个参数传给PredictorArgument，同时load完模型后初始化kv cache
![Image](https://github.com/user-attachments/assets/0cf36496-a418-4589-9d07-0da94bc2f9a9)