融合RL与LLM思想,探寻世界模型以迈向AGI「中·下篇」