「生成式 AI」和「分辨式 AI」有哪裡不一樣？|最新文章

「生成式 AI」和「分辨式 AI」有哪裡不一樣？

112/03/30 116837

李育杰｜國立陽明交通大學應用數學系教授

圖一：ChatGPT 只是生成式 AI 的一種形式，這種生成人工智慧可以創造出原本不存在的音樂、圖像、語言和其他形式的數據。（影像來源：shutterstock）

過去常說「科技日新月異」，在我過去五十多年的歲月裡，直到去年年底才出現這種感受。2022 年 11 月 30 日 OpenAI 發表 ChatGPT，不到一週突破百萬用戶，支援多國語言與友善的人機介面，即使在有網路嚴密控管的中國，也翻牆出來體驗 ChatGPT 的神奇之處，迅速積累破億用戶。今年 3 月 14 日公布更強大的 GPT4 的大型語言模型（LLM, Large Language Model），GPT3 有 1750 億的參數，ChatGPT 使用 GPT3.5 約 2000億。GPT4 應大過 GPT3.5 數倍，但 OpenAI 刻意不揭露。

而 ChatGPT 只是生成式 AI 的一種形式，這種生成人工智慧可以創造出原本不存在的音樂、圖像、語言和其他形式的數據。包括： OpenAI 的 DALL-E 2、Midjourney v4，讓你可以用簡易的線條或簡單的文字描述、風格設定，快速生成影像。而各項不同的應用也如雨後春筍般的湧現。

Q1：「生成式 AI」因為 ChatGPT 來到爆發奇異點，「生成式 AI」和「分辨式 AI」有哪裡不一樣？

生成式人工智慧（Generative AI）和分辨式人工智慧（Discriminative AI）是人工智慧中兩個重要的概念。

首先理解一下分辨式人工智慧（Discriminative AI），顧名思義，這是需要有標注標籤資料以供「分辨」，我們常以(X, y)來表示有標注標籤的資料，X 代表資料本身，y 表示其標籤。從分辨區隔手中的標注資料，進而「訓練」篩選出一個好的分類器（Classifier），用於對那些沒有「標注」僅有 X 的資料，預測其標籤 y。具體來說，分辨式模型依據有限的資料分佈與其對應的標籤找出一映射的函數 F(X)，用此函數值當成X 所對應的標籤 y。分辨式 AI 模型的代表性算法包括支持向量機（SVM）、決策樹（Decision Tree）、羅吉斯迴歸（Logistic Regression）等。從這樣的學習模式，不難想像，需要倚賴大量高品質具有標籤的標注資料，當然也提高了模型訓練成本，限縮大型複雜分辨式 AI 模型的發展。

而生成式 AI 模型與分辨式模型就根本的差異，在於生成式 AI 模型巧妙運用大量沒有標注標籤的資料 X，試圖自我產生資料與隱藏於資料中的訊息。而移除標注資料的限制後，讓大型的複雜模型的訓練，藉助於強大 GPU 的算力與大量的資料，得以實現。生成式 AI，雖無必要使用有標注標籤的資料，但若仍有標注標籤的資料合併使用，訓練過程中再引入強化學習（Reinforcement learning）機制，可協助引導模型快速朝向「正確」合用的方向收斂。而這樣的模式，也讓通用性的人工智慧漸露曙光。這種人工智慧可以創造生成出自然語言、音樂、圖像和其他形式的資料。

Q2：「生成式AI」有哪些潛力？

很自然的在各種形式的內容產生，生成式 AI 能夠生成自然語言、圖像、音訊等多種類型的內容。創造出新內容，如文章、故事、詩歌、音樂等。這樣的創造力可以在許多領域中得到應用，例如文學、音樂、設計等。事實上，已有多本書籍是由生成式 AI 「創作撰寫」於亞馬遜網路書局販售。這些數位內容產生快速且低成本，直接應用在遊戲產業與虛擬擴增實境之上，帶動這些內容產業的發展。ChatGPT 讓大家體驗人機流暢的對答模式，這樣的人機互動，將形成風潮，導入在各式聊天機器人，可以是伴隨機器人、擬真人的客服系統、自然語言搜索等。而由於生成式 AI 背後的隨機性，可以自動生成設計各類藝術創作，刺激創作靈感，人類可以不再腸枯思竭。

從去年 11 月 30 日 ChatGPT 發布，過去四個月來，非常多生成式 AI 的應用已紛紛湧現，這些技術正快速地擴散，不久將會全面改變我們的工作方式。

Q3：「生成式設計」會對製造業產生什麼樣的衝擊？

有了生成式 AI 的理解，無論是從文字生成影像、影像生成影像，利用過去積累的大量資料，以引導式的訓練生成方式，將其運用於設計製造，讓系統自動創建生成新的產品設計，從而提高設計效率和創造力。

這樣新型態的設計作業流程，對於製造業來說，可以直接提高產品設計效率，從而減少人工設計的時間和成本，迅速生成多項設計方案，供設計工作人員可以選擇，並進行引導式的修正生成。例如可以快速生成 3D 模型，可視覺化對產品修改，從而更好地展示和驗證設計方案。必要時，也可以很快速得到市場與消費者的反饋，使其所設計的產品更符合市場的期待與終端消費者需求。而生成式設計本身也含有隨機性，從而創造出從未存在過的新設計。當然，在這樣的流程中，也須謹慎小心，避免使用生成式 AI 服務的過程中，洩露公司的生產計畫與機敏的資料。

了解新興科技潛在風險，才能有效駕馭科技帶來的美好

生成式 AI 的橫空出世，確實又將人工智慧的發展推向一個嶄新的紀元。整個機器學習的模式也有革命性突破，可以巧妙運用巨量的無標注資料，降低資料標注成本。然而，資料品質的好壞，仍主導著生成式 AI 模型的品質。存在著資料偏頗的風險。當然，也有著資訊安全與隱私上的疑慮，因此，筆者一直提醒大家，機敏的問題不要問 ChatGPT，重要的內部文件，千萬不要讓 ChatGPT 幫忙翻譯。同時，生成式 AI 產出結果的正確性，也是需要使用者用心思考，獨立判斷。深入了解新興科技潛在的風險，才能有效駕馭科技帶來的美好。