首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ChatGPT如何工作:

•ChatGPT的工作原理是大型語言模型(large language model,簡稱LLM),是AI領域相對較新的訓練模型,約在5年前首次出現,如今已可以撰寫各種文章。

第1步 設定目標

•AI系統須預先設定目標函數,大多數LLM模型的基本目標函數為:給定一個文本序列,猜測接下來的內容。

第2步 收集大量數據

•大量收集訓練數據,ChatGPT等通常從互聯網上搜集數十億個頁面作為數據庫,如博客文章、推文、維基百科和新聞。

第3步 建立神經網絡,組裝「大腦」

•數據被拆分成標記單元輸入模型,可是單詞、短語或單個字符。接下來組裝人工智能的「大腦」:即AI的神經網絡系統。這是一個由相互連接的節點(或「神經元」)組成的複雜網絡,用於處理和存儲信息。

第4步 訓練AI「大腦」

•通過訓練,該AI模型學會分析數據,識別不同模式和關係,學會如何構建有意義的信息。相關訓練耗時幾天甚至幾周,耗費巨大的計算能力。

第5步 微調模型

•一個大型語言模型被訓練出來,需要為特定的工作或領域進行校準,通常由人類進行微調。

第6步 上線啟動

來源:《紐約時報》

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230411A00NBS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券