4 月 29 日,我写过两次的谷歌免费笔记神器 Notebooklm,正式支持从用户指定的资料来源生成中文语音播客。真正的对话式语音播客。
放一段效果来听听。
从去年开始使用 Notebooklm,我一直很喜欢这个产品。它看起来很简单,但只要你慢慢用起来,就会发现它的细致入微。想要完整复现一套 Notebooklm 的产品功能,并不容易。简单的聊天界面背后,有精巧设计的提示词和代码。
加持 Gemini 2.5 Pro 之后,Notebooklm 对材料的解析和总结能力再上一层。各种笔记分析工具之间不是割裂的关系,而是有互动。比如思维导图,可以点击某一个议题,直接进入到聊天窗口,针对你点击的议题从素材库中提取相关信息做概要,并且支持进一步深度对话。
如果想要深入解读,剖析一本书,思维导图功能相当好用。目前的缺点在于,对超长的书籍,思维导图能够覆盖的知识面有限,还是会落下可能很重要的信息。
所以,Notebooklm 诸多工具存在的意义,并不是帮助用户完成“5 分钟带你读完上下五千年”之类的“壮举”,而是辅助学习工具。
读书,不应该过度追求效率,用数量伪装知识,满足自己的虚荣心。工具的意义是帮助读者更好,更快的理解复杂概念,而不是假装阅读。
之前 Notebooklm 最令人成道的即是语音播客功能。对话式的口播,对答如流,语气放松,是我听过最像真人的 AI 语音。而且,英文播客还可以随时点击按钮,中途提问。AI 主持人真的会重新根据你的问题作答,并非一成不变的念稿。
中文播客目前还不支持提问功能,相信不远的将来也会上线。
免费版的 Notebooklm 一天可以生成 3 个音频概览,也就是对话式播客。付费版 Plus 用户是每天 20 个,我够用了。
Notebooklm Plus 版包含在 Gemini Advanced 套装中,你只要有.edu 结尾的学生邮箱即可申请 15 个月免费。具体步骤看我之前的文章:
我希望 Notebooklm 接下来能够按章节分割素材,生成更加细致的音频概览和思维导图。这样更符合人类学习的节奏,也能避免一股脑从庞大的内容中抽取关键信息导致的内容失真。
采样密度越高,信息的还原程度越高。具体的采样密度,应该由用户决定。
Notebooklm 的价值在于它开启了 AI 学习的新范式,让 AI 在自己最擅长的归纳总结和内容生成上发挥作用,提高人类的学习效率。AI 并不真的懂它在看什么,但它能够用数学的方法找重点,发现人类的学习盲区并加以修正。
有了这些辅助,学渣也能变学霸,只要肯学。
在 Github 上,已经有人复现了 Notebooklm 的语音播客功能,并且开源。项目所需资源不大,1.6B 规模模型,用户使用普通 GPU 即可生成带语气,惟妙惟肖的语音播客。这个项目叫 Dia,现在只支持英文。
项目地址:https://github.com/nari-labs/dia
看来,以 Notebooklm 为蓝本的一批 AI 产品正在路上。实在用不上 Notebooklm 的同学,可以耐心等待。
效果炸裂的播客工具就快来了。未来出现互动式播客,针对每个听众提问自适应的 AI 主持,不是梦。
领取专属 10元无门槛券
私享最新 技术干货