生成式 AI(Generative AI 或 AIGC)
是利用現有文字、影音文件或圖象建立
新知識的專業技術。過去一年,其技術的
進度主要來自于三大領域:圖象生成領
域,以 DALL·E-2、Stable Diffusion 為
所代表的擴散模型(Diffusion Model);
自然語言理解(NLP)領域根據 GPT-3.5
的 ChatGPT;代碼生成領域根據 Codex
的 Copilot。目前的生成式 AI 通常被
用于生成產品原型或原稿,應用領域涵
蓋圖文創作、代碼生成、手機游戲、廣告宣傳、
造型藝術廣告設計等。將來,生成式 AI 將成為
為一項平民化基礎技術,極大的提高
智能化視頻的豐富度、創造力與生產效
率,其應用界限都將伴隨著技術的發展與
成本的降低拓展到大量領域。
發展趨勢十
生成式 AI 使用各種人工智能算法,
從數據中學到因素,使設備可以創
建一個全新的數字信息、圖象、文字、聲頻或
編碼等相關信息。它建立出的內容與訓練數據
維持類似,并非拷貝。它的發展歸功于近
年以來大模型在基礎科研特別是深度神經網絡上
的創新,真正數據庫的不斷積累核算成本的后
降。在過去這一年,生成式 AI 將人工智
平衡的使用價值聚焦到“造就”二字,標志著人
工智能逐漸具有定義和展現新生事物的能力。
過去一年,生成式 AI 的進展關鍵體
如今如下所示領域:
圖象生成領域的進展來源于擴散模型
(Diffusion model)的 應 用,以 DALL·
E-2、Stable Diffusion 為首。擴散模型
是一種從噪音中生成圖像的人工智能算法。
擴散模型技術性背后,是更準確了解人們
詞義的預訓練模型、及其文字與圖象統一
表明實體模型(CLIP)支撐。它的存在,讓
圖象生成越來越更具有想像力。
自然語言理解(NLP)領域的進展來
自于根據 GPT3.5 的 ChatGPT(Generative
Pre-trained Transformer)。這也是一種基于
互聯網技術可以用數據訓練的文字生成深度神經網絡
實體模型,用以互動問答、文本摘要生成、設備翻
譯、歸類、代碼生成和會話 AI。歸功于文
本和編碼結合的預訓練大模型的高速發展,
ChatGPT 引進了人工標注數據和增強學習
(RLHF)去進行不斷練習和改進。添加強
化課程后,大模型能理解人們的指令以
及身后的內涵,依據人們意見反饋來判定回答
的品質,得出可解釋性的回答,并針對不符合
適的難題得出有效的回應,形成一個可迭
代反映的閉環控制。
代碼生成領域的進展來源于代碼生成系
統 AlphaCode 和 Copilot。2022 年 2 月,
Deepmind 發布了他們的最新研究成果
AlphaCode。這是一個可以獨立程序編寫的系
統,在 Codeforces 舉行的編程競賽中,超
過去了 47%人類技術工程師。標志著 AI 代
碼生成系統軟件,**次在編程競賽中,達到
具有競爭力的水準。根據開放源碼鍛煉的
Copilot 逐漸商業化的,做為訂閱服務發放給
開發人員,用戶可以通過應用 Copilot 全自動補
全編碼。Copilot 作為一個根據大中型語言表達模
型的軟件,雖然在大多數情況下仍然需要人工
二次調整,但簡易、可重復性的代碼生成上,
將幫助開發人員提高工作效率,并為 IDE(集
成開發工具)行業帶來深遠影響。
伴隨著具體內容創造出來的井噴式增長,怎樣做
到信息在質量與語義上的可控性,變成可控性
式生成,無疑是生成式 AI 所面臨的關鍵考驗。
在產業發展領域,降低成本仍然是重要考驗。只
有象 ChatGPT 這種級別的模型訓練費用和推
理成本費充足低,才可能產業化營銷推廣。除此之外,
數據庫的安全可控、寫作著作權和信任問題也
必須伴隨著產業發展加速逐一處理。
未來三年,生成式 AI 將踏入創新產品
變的快速道路,在運營模式上會越來越多探尋,
產業生態會隨著運用的興起不斷完善。屆
時,生成式 AI 內容造就能力有望突破人們
水準。有著數據信息、測算能力、實用化工作經驗的
大中型科技有限公司將成為生成式 AI 落地關鍵
參加者。根據生成模型測算基礎設施建設友誼
臺會逐步發展下去,實體模型變為隨手可得的服
務,顧客不用布署和運行生成式模型專
業專業技能就可以使用。生成實體模型將于互動能力、
安全可信、認知智能中取得明顯進度,以輔
助人們進行各種創造性工作