使用GPT的视觉功能和TTS API处理和讲述视频