!pip install python-pptx
!apt-get install -y pandoc
from google.colab import files
uploaded = files.upload()
pptx_files = {file_name: file for file_name, file in uploaded.items() if file_name.endswith('.pptx')}
print("没有找到 PPTX 文件,请上传 PPTX 文件。") #执行报错检查
# 假设只上传了一个 PPTX 文件,取第一个文件
pptx_file_name = next(iter(pptx_files))
print(f"上传的 PPTX 文件名: {pptx_file_name}")
# 执行 pptx2md 脚本,转换 PPTX 文件到 Markdown
!pptx2md {pptx_file_name}
# 将 Markdown 文件转换为 TXT 格式
!pandoc out.md -o output.txt
files.download('output.txt')