Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >AI 大模型的风,吹到了浏览器

AI 大模型的风,吹到了浏览器

作者头像
云水木石
发布于 2024-06-14 12:20:04
发布于 2024-06-14 12:20:04
36100
代码可运行
举报
运行总次数:0
代码可运行

Chrome 浏览器是谷歌最重要的产品之一。在互联网时代,掌握着流量的入口,帮助谷歌建立起了互联网霸主的地位。Chrome 浏览器不仅在市场占有率方面遥遥领先,还成为了许多用户接入互联网的首选工具。凭借其速度、安全性和丰富的扩展功能,Chrome 浏览器在全球范围内积累了庞大的用户基础。

进入 AI 时代,谷歌也在不断强化其重要性,致力于将前沿技术融入到浏览器中。谷歌不遗余力地开发了 TensorFlow.js,这是一个可以在浏览器中运行的机器学习框架,使得前端开发者能够在客户端实现复杂的 AI 算法。此外,谷歌还推出了 WebGPU,这项技术大大提升了浏览器在图形和计算处理方面的性能,展示了前端技术的无限潜力。

与此同时,以 ChatGPT 为代表的 GPT 大模型近年来风光无限,推动了人工智能的迅猛发展。OpenAI,这家成立不到十年的公司,凭借其创新和技术实力,迅速成为 AI 领域的领导者。相比之下,昔日的互联网霸主谷歌在这一波浪潮中显得光芒暗淡了一些。

然而,谷歌并未在大模型领域停滞不前。相反,它积极推出了 Gemini 系列模型,力图在这一领域重新夺回优势。

如今,谷歌将大模型的能力进一步扩展到了浏览器中,通过将 AI 集成到 Chrome 浏览器,谷歌希望为用户提供更加智能化和个性化的上网体验。无论是搜索、信息获取还是在线服务,AI 技术的融入都将显著提升浏览器的功能和用户体验。

在大多数人的印象中,AI 模型庞大且需要大量计算资源,通常依赖云端服务器来运行。传统的客户端/服务器开发模式简化了应用开发,但带来了高昂的部署成本,并存在数据安全和用户隐私问题。如果能够充分利用用户主机的计算资源,不仅能发挥当前 AI PC 的性能,还能降低成本,并缓解数据安全和隐私问题。

由于 Web 开发的特殊性,通常无法直接访问计算机硬件资源,只能通过插件或服务转接来实现。那么,有没有更好的方法呢?

为了解决这一问题,Chrome 浏览器在最新的 Canary 版本(开发版本,本文发布时的最新版本为 127.0.6526.0)中,首次将 AI 大模型直接内置到浏览器中,实现了 Web AI 的触手可及。这一创新使得 AI 应用不再局限于云端,用户可以在本地直接体验 AI 的强大功能。

下面就带大家体验一下 Chrome 内置大模型。(友情提醒:需要访问国外网站

  1. 下载 Chrome Canary 版本,可以通过访问如下链接下载 Windows 64 位版本:

https://www.google.com/chrome/canary/?platform=win64

  1. 开启相关功能。目前 Web AI 还是实验性功能,默认没有开启。在 Chrome 地址栏输入 chrome://flags/,找到如下两个选项:
  • Prompt API for Gemini Nano
  • Enables optimization guide on device

将其值都修改为 Enable。

  1. 重启 Chrome 浏览器,使设置生效。
  2. 下载模型。在 Chrome 地址栏输入 chrome://components/,找到选项:
  • Optimization Guide On Device Model

如果后面显示的版本号为 0.0.0.0,表示模型还未下载下来,可以点击一下下方的检查是否有更新按钮,手动启动下载。

然后耐心等待,这个模型下载有点慢。下载完毕后,会显示出版本号。

模型下载完毕后,重启一下 Chrome 浏览器

  1. 验证模型能否工作。打开开发者工具,切到控制台,输入以下代码:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
async function testGeminiNano() {
  try {
    if (!window.ai) throw new Error("AI API not supported.");
    if ((await window.ai.canCreateTextSession()) !== "readily") {
      throw new Error("Gemini Nano not ready yet.");
    }
    console.log("Gemini Nano is ready to use!");
    const session = await window.ai.createTextSession();
    const stream = session.promptStreaming("Tell me a jok!");
    for await (const chunk of stream) {
      console.log(chunk); 
    }
    session.destroy();
  } catch (err) {
    console.error(err.message);
  }
}

testGeminiNano();

如果一切顺利,你将看到控制台输出一个笑话:

Why did the scarecrow cross the road? To get to the other side!

这代表成功调用了 Chrome 内置的 Gemini Nano 模型。

今天是端午节,来一段端午节祝福吧!

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(async () => {
  try {
    if (!window.ai || (await window.ai.canCreateTextSession()) !== "readily") {
      throw new Error("Gemini Nano not ready or not supported.");
    }

    const startTime = performance.now();
    let charCount = 0;

    const session = await window.ai.createTextSession();
    const stream = session.promptStreaming("撰写一段简短的端午节祝福,100字以内。");
    let message = "";
    for await (const chunk of stream) {
      message = chunk;
      charCount = chunk.length;
    }

    const endTime = performance.now();
    const timeElapsed = (endTime - startTime) / 1000;

    console.log(message);

    session.destroy();
  } catch (error) {
    console.error(error);
  }
})();

写在最后

Chrome 浏览器内置的 AI 大模型名为 Gemini Nano,它是 Google 最新推出的 Gemini 系列中最轻量级的版本,专为在设备端高效运行而设计。这意味着它无法像 ChatGPT 4.0 或 Gemini Pro 那样提供强大的功能。同时,由于 Chrome 浏览器运行的设备各不相同,能否启用这一功能还取决于硬件配置的多样性,这也是 Chrome 浏览器未默认开启该功能的原因。此外,Web AI API 何时能成为标准也需要一个过程。

Web AI 为我们描绘了一个美好的愿景,但离真正实用还有漫长而艰难的道路。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云水木石 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Puppeteer:从零出发,全面掌握浏览器自动化神器
Puppeteer 译为木偶,是一个 Node.js 库,内部通过 DevTools 协议提供控制 Chrome 或 Firefox 的一系列 API。通过定义可以看出 Puppeteer 的核心在于提供用户控制浏览器行为的方法,以下是一些自动化入门示例:
前端小鑫同学
2024/07/12
2.1K0
Facebook 将对 React 的优化实现到了浏览器!
想要提高一个网页的加载速度是非常困难的,如果你的网站是在使用 JavaScript 渲染的内容,你必须要在网页的加载速度和网页的输入响应能力之间作出权衡:
viktor
2022/09/19
6290
Facebook 将对 React 的优化实现到了浏览器!
Chrome 居然提供了可以直接调用 LLM 的 API!
AI 时代的高速发展,我们都习惯了使用 ChatGPT、Claude、Gemini 和其他 AI 工具来询问各种问题,目前大部分的 AI 应用都是通过服务端 API 来实现的。
ConardLi
2024/07/25
3750
Chrome 居然提供了可以直接调用 LLM 的 API!
前端监测浏览器渲染帧率fps
在前端性能优化中,尤其是动画绘制中,我们需要关注浏览器的渲染频率FPS(每秒传输帧数(Frames Per Second)),在Chrome浏览器上我们可以通过Performance 查看渲染Fps:
伯爵
2020/05/21
3.4K0
浏览器中玩人脸识别
其实浏览器中的人脸识别 API 已经发布有一段时间了,从Chrome 70 版本以上就有了。其中包括了人脸,文本或 QR 码的识别,基本上覆盖了当前互联网应用的大部分场景。
IMWeb前端团队
2019/12/04
1.7K0
window.ai 开启你的内置AI之旅
因为,行文字数所限,有些概念可能会一带而过亦或者提供对应的学习资料。请大家酌情观看。
前端柒八九
2024/07/15
2060
window.ai 开启你的内置AI之旅
Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。
猫头虎
2024/05/24
3380
Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
浏览器中集成 AI 的三种方式
进入移动互联网时代,浏览器的重要性有所下降,其地位被几款超级 App 取代。然而,在 PC 端,浏览器依然是最重要的应用,仍是人们踏入互联网世界的关键入口。
云水木石
2024/07/18
3030
浏览器中集成 AI 的三种方式
浏览器就能跑大模型了!陈天奇团队发布WebLLM,无需服务器支持
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 现在,只需一个浏览器,就能跑通“大力出奇迹”的大语言模型(LLM)了! 不仅如此,基于LLM的类ChatGPT也能引进来,而且还是不需要服务器支持、WebGPU加速的那种。 例如这样: 这就是由陈天奇团队最新发布的项目——Web LLM。 短短数日,已经在GitHub上揽货3.2K颗星。 一切尽在浏览器,怎么搞? 首先,你需要下载Chrome Canary,也就是谷歌浏览器的金丝雀版本: 因为这个开发者版本的Chrome是支持WebGPU的,否则就
量子位
2023/05/06
3770
浏览器就能跑大模型了!陈天奇团队发布WebLLM,无需服务器支持
Js自动播放HTML音乐(不受浏览器限制,无需先与浏览器交互,无需对浏览器进行修改)
众所周知,声音无法自动播放一直是IOS/Android上的惯例。桌面版Safari也在2017年第11版宣布禁止带声音的多媒体自动播放功能。随后2018年4月发布的Chrome 66正式关闭了声音的自动播放,这意味着音频自动播放和视频自动播放在桌面浏览器中也会失效。
宜轩
2022/12/29
6.6K0
浏览器也拥有了原生的 “时间切片” 能力!
就在 Chrome 115 版本,浏览器开始了对 scheduler.yield 的灰度测试。scheduler.yield 是 scheduler API 中新增的一个功能,它能以更简单、更好的方式将控制权交还给主线程。在开始讲解这个 API 之前,我们先来看一个新的性能指标。
ConardLi
2023/09/11
3030
浏览器也拥有了原生的 “时间切片” 能力!
WebRTC 之 MediaRecorder_ 用你的浏览器录音和录像
既然现在的笔记本电脑,平板,手机都有摄像头和麦克风,那么录音和录像就是一件非常容易的事情了,但是如果不用别人写好的录音录像程序,让你自己来实现一个录音和录像应用,其实也没那么简单。
前端小tips
2021/11/30
1.9K0
WebRTC 之 MediaRecorder_ 用你的浏览器录音和录像
在Chrome浏览器中最快速实现拾色器(颜色吸管)的方法
说到网页拾色器(颜色吸管工具)在前端的实现方法,通常我们会想到先进行网页截图,然后通过Canvas绘制截图,此时利用Canvas所提供的的API即可解析出图片每个像素点颜色,最后通过获取鼠标定位,得到当前的坐标来进行颜色选择。
茶无味的一天
2022/10/06
2.1K0
爬虫使用浏览器渲染的一些最佳实践
在做爬虫的时候,总会遇到一些动态网页,他们的内容是 Ajax 加载甚至是加密的。虽然说对于一些大站来说,分析接口是值得的,但是对于众多的小网站来说,一个一个分析接口太繁琐了,这时候直接使用浏览器渲染就简单得多了。
爬虫技术学习
2023/02/10
2.4K0
爬虫使用浏览器渲染的一些最佳实践
WebAssembly 和 JavaScript 该怎么选?
JavaScript 已经长久以来并且目前依然是浏览器运行时的主流开发语言,然而近年来,WebAssembly 的诞生为我们提供了一个全新的选择。这就引出了一个值得我们探索的问题:在浏览器运行环境中,哪个语言的性能更优越,JavaScript 还是 WebAssembly?
ConardLi
2024/01/23
4360
WebAssembly 和 JavaScript 该怎么选?
手写 Puppeteer:自动下载 Chromium
Puppeteer 是一个网页的自动化测试工具,它支持写一些 JS 脚本来控制浏览器执行一些行为,可以用来跑测试用例,或者用来做爬虫。
神说要有光zxg
2022/11/11
1.8K0
手写 Puppeteer:自动下载 Chromium
腾讯云大模型知识引擎 + DeepSeek:打造懒人专属的谷歌浏览器翻译插件
在这个信息爆炸的时代,互联网就像一个巨大的知识宝库,而我,一个对新知识充满渴望的探索者,每天都在这片海洋中遨游。我热爱阅读各种英文网站,从科技前沿到文化趣闻,从学术研究到生活小技巧,无一不让我着迷。然而,最近我遇到了一个小小的烦恼——英文翻译。
LucianaiB
2025/03/02
4563
腾讯云大模型知识引擎 + DeepSeek:打造懒人专属的谷歌浏览器翻译插件
浏览器画中画模式
浏览器画中画模式 浏览器画中画功能允许用户在一个小的叠加窗口中弹出网页中播放的视频 ?,Chrome 版本大于 71 均默认开启该功能。下面简单介绍一下该 API 如何使用 ? 准备工作 首先要有个
JS菌
2019/04/10
3.3K0
浏览器画中画模式
可以浏览器页面运行 node 代码里了!webContainer 发布 1.0
2021年5月12日, stackblitz 团队在 谷歌 I/O 上提到了一下的内容:
CandyTong
2023/02/24
1.3K0
可以浏览器页面运行 node 代码里了!webContainer 发布 1.0
基于 ChatGPT API 的划词翻译浏览器脚本实现
最近 GitHub 上有个基于 ChatGPT API 的浏览器脚本,openai-translator, 短时间内 star 冲到了 9.7k, 功能上除了支持翻译外,还支持润色和总结功能,除了浏览器插件外,还使用了 tauri 打包了一个桌面客户端,那抛开 tauri 是使用 rust 部分,那浏览器部分实现还是比较简单的,今天我们就来手动实现一下。
狂奔滴小马
2023/04/07
1.6K0
基于 ChatGPT API 的划词翻译浏览器脚本实现
推荐阅读
相关推荐
Puppeteer:从零出发,全面掌握浏览器自动化神器
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验