大家好,我是向善,一名 AI 博主。我的目标是通过分享 AI 知识、AI工具、AI 副业案例,影响 10W 人一起拥抱 AI。
大家好,我是向善。
上一篇文章,分享了Gemini CLI安装过程中遇到的坑和解决方法。
一份迟来的 Gemini CLI 安装避坑指南!
今天,从使用者的角度有什么新奇的玩法,分享上手Gemini CLI后的感受。
文档提炼总结、格式转换、批量归档/重命名,以及视频添加、移除水印、图片裁切、水印等。
通过自然语言指令直接驱动复杂任务,无需手动编写脚本。
为什么说 Gemini CLI 很强呢?
强大的模型支持
• 搭载Gemini 2.5 Pro模型,支持高达 100 万token的上下文窗口,可以处理超长的代码库和文档。
• 具有多模态能力:支持文本、代码、图像、PDF 等格式的输入与生成(例如通过Imagen生成图像、Veo生成视频)
智能工具链集成
• 内置工具协议(MCP):可连接外部工具(如Google搜索、Git 操作、数据库等),实现动态信息获取与任务自动化。
• 文件交互:通过@文件名引用本地文件,Gemini可分析内容并生成代码、总结文档或修复 Bug。
• 命令执行:使用 ! 前缀直接运行 Shell 命令(如 !ls -la)。
开源与免费政策
• 基于Apache 2.0许可证开源,开发者可自由定制功能。
• 免费额度:个人Google账号认证后,每分钟可发送 60 次请求,每日上限 1000 次。
基础用法
文档提炼和总结
在阅读长文时,希望整理核心观点,进行总结。就可以直接告诉Gemini CLI。
例如:想阅读借助AI,10倍提效公众号写作.pdf文档内容提炼核心观点,输出到AI写作核心.md文件。
只需告诉Gemini。
总结 @借助AI,10倍提效公众号写作.pdf 文档内容,提炼核心观点,输出到 AI写作核心.md 文件。
效果:
Gemini 轻松将文档核心内容提炼出来。
发散下思维,工作和学习都可以用到。例如:会议纪要 ——> 待办事项;技术文档 -> 结构化报告等等。
文件格式转换
将 PDF 文件转为 Markdown 可编辑文件。
转换 @借助AI,10倍提效公众号写作.pdf 为可编辑的 markdown 文件。
看上图,即使图表也能轻松解析。PDF 转文档再也不需要 WPS 会员了。
批量文件重命名与归档
整理杂乱下载文件夹。只需告诉Gemini你的移动要求即可。
将当前文件夹中的 .md 文件移动 /markdown 夹, PDF 移动到 /PDF 文件夹。
演示只有几个文件,如果你有成百上千个文件需要分类、移动、重命名。 使用Gemini CLI可以大幅提升效率。
高级用法
视频添加/移除水印
让Gemini CLI操作 ffmpeg 库实现视频编辑能力。
首先安装ffmpeg,直接告诉Gemini CLI让他帮忙安装。输入:帮我安装 ffmpeg 库并配置环境变量。
Gemini CLI会先帮你安装,如果安装不成功,也会提供安装指令,手动以管理员权限在PowerShell 执行就行。
Windows电脑,先安装的Chocolatey管理工具,然后通过choco install ffmpeg进行安装。
执行 ffmpeg -version 验证是否安装成功。
然后,让 Gemini 帮我们给视频添加水印。
使用 ffmpeg 在 @videos/v_1.mp4 右上角打一个 10% 透明度的水印,水印内容“xiangshan”,输出为新视频。
看效果图,添加上了水印 xiangshan ,是不是很简单。
可以添加水印,移除水印也不再话下。快去试试吧!
截取视频片段
可以从一个视频或音频文件中提取特定时间段的内容。例如:提取视频第 10 秒到第 30 秒的部分
@videos/video.mp4 使用 ffmpeg 提取 10 秒到 30 秒的内容,保持到 10_30.mp4 。
上面,只是举了两个例子,ffmpeg 还可以干很多工作,提取音频,调整分辨率、拼接等等。剪映的底层就有它的身影。
图片裁切
通过上面的例子,可以再发散下思维,让Gemini CLI使用某个库进行某项操作。
你可能说不知道有哪些库,可以向Gemini提问啊。
下面以处理图片为例,我需要Gemini CLI把图片进行九宫格裁切,但不知道使用什么库可以实现?
我们可以想Gemini提问,什么库可以操作图片
告诉Gemini你想如何操作图片?可以指定使用某个库,也可以不指定,让Gemini自己选择。
这里我们使用Python的Pillow处理图片。
使用 Pillow 库将 @image1.png 图片裁切成 9 宫格图片,保持到 images 文件夹中,文件命名为 image_序号.png
Gemini会自动写脚本,一开始直接在Window终端执行Python脚本,但是执行失败了。
Gemini回复说 Window 系统会出现执行失败的情况,然后自动创建了 python 脚本文件,自动运行脚本。
最终达到了上面图片的效果。
添加水印
Gemini CLI支持图片添加水印,只需告诉它:
@image1.png 在该图片的右上角添加‘xiangshan’水印。
总结
以上就是Gemini CLI的强大之处!
不仅仅是一个命令行工具,更像一个理解你意图、精通各类工具的“超级助手”。
使用Gemini CLI意味着获得了一种全新的工作流:用语言直接驱动数字世界,办公提效、探索自动化都不在话下。推荐你尝试下。
往期精彩文章
期待你的
分享
点赞
在看