分享
如何在 Claude Code 中优雅集成 Gemini CLI(免费+多模态+长上下文)
输入“/”快速插入内容
如何在 Claude Code 中优雅集成 Gemini CLI(免费+多模态+长上下文)
用户4242
用户4242
2025年12月25日修改
🔗 原文链接:
https://mp.weixin.qq.com/s/yHwCwHPi...
原创 AI陪我笨拙前行 AI陪我笨拙前行
2025年12月25日 07:32 北京
大家好,我是小四。
假设一个场景:你正在用 Claude Code 干活,突然收到一段 40 分钟的会议录音,需要整理成会议纪要。
第一反应是丢给 AI。但打开 Claude Code 准备处理时,发现一个问题:
Claude Code 无法完美处理音频文件
。因为Claude不原生支持音视频。
这时候我们很自然的就想到了 Gemini CLI,Google 的 Gemini 原生支持音频和视频。
下面两个办法你肯定都能想到:
1.
打开免费的gemini studio Web端上传、分析,复制结果回来
2.
安装gemini cli,新开一个终端窗口,不用上传,一行命令就能搞定:
代码块
Plain Text
gemini -p
"帮我整理这段会议录音的要点"
meeting.mp3 --yolo
但你有没有发现:正在 Claude Code 里干活,为了处理这个音频,得另开一个终端窗口,敲完命令,再把结果复制回来。
两个窗口切来切去,体验很割裂。更别提做完全自动化流程了。
那有没有办法让 Claude Code 直接调用 Gemini CLI?这样就全搞定了
Gemini CLI 凭什么值得集成
在讲怎么集成之前,先说说 Gemini CLI 有什么独特价值,为什么值得折腾。
第一,100 万 token 的上下文窗口。
这意味着什么?你可以把一整个代码仓库一次性丢给它分析。Gemini CLI 有个
--all-files
参数,直接扫描当前目录所有文件:
代码块
Plain Text
gemini --all-files -p
"分析这个项目的架构"
--yolo
不用你手动拼接文件内容,不用担心超长度,它自己搞定。
第二,原生多模态支持。
图片、PDF、音频、视频,直接传文件路径就能分析:
代码块
Plain Text
gemini -p
"描述这张图片"
screenshot.png --yolo
gemini -p
"总结这份报告"
report.pdf --yolo
gemini -p
"提取会议要点"
meeting.mp3 --yolo
甚至还能处理超大的音视频,这对特定的场景太有诱惑力了。
这是目前 Claude Code 做不到或做不好的场景。
(有兴趣的同学可以试试,Claude code没说不支持,但是他是通过写脚本处理这些音视频,和原生支持的AI相差太远了。)
第三,免费额度够用。
Gemini CLI 每天都有一些免费额度,甚至最高级的gemini-3-pro也可以使用。对于个人使用来说,完全够了。
这三点加起来,让 Gemini CLI 成为 Claude Code 的完美补充——
它擅长的,正好是 Claude Code 不擅长的
。
自认为优雅的使用
我自己一般有如下三种方案来使用,也欢迎大家讨论提供更好的
最简单的方案:直接 Bash
既然 Claude Code 有 Bash 工具,最直接的方式就是让它执行 Gemini 命令: