ChatGPT如何工作：

文章来源：企鹅号 - 大公报

•ChatGPT的工作原理是大型語言模型（large language model，簡稱LLM），是AI領域相對較新的訓練模型，約在5年前首次出現，如今已可以撰寫各種文章。

第1步設定目標

•AI系統須預先設定目標函數，大多數LLM模型的基本目標函數為：給定一個文本序列，猜測接下來的內容。

第2步收集大量數據

•大量收集訓練數據，ChatGPT等通常從互聯網上搜集數十億個頁面作為數據庫，如博客文章、推文、維基百科和新聞。

第3步建立神經網絡，組裝「大腦」

•數據被拆分成標記單元輸入模型，可是單詞、短語或單個字符。接下來組裝人工智能的「大腦」：即AI的神經網絡系統。這是一個由相互連接的節點（或「神經元」）組成的複雜網絡，用於處理和存儲信息。

第4步訓練AI「大腦」

•通過訓練，該AI模型學會分析數據，識別不同模式和關係，學會如何構建有意義的信息。相關訓練耗時幾天甚至幾周，耗費巨大的計算能力。

第5步微調模型

•一個大型語言模型被訓練出來，需要為特定的工作或領域進行校準，通常由人類進行微調。

第6步上線啟動

來源：《紐約時報》

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货