從一個打字的聊天機器人,到能看、能聽、能說話的 AI——OpenAI 正在一個接一個地打造未來。而最大的問題不是 AI 能做什麼,而是你會用它做什麼。

能看見和聽見的 AI

在人類歷史上大部分時間裡,跟電腦說話意味著在鍵盤上打字。但 OpenAI 想像了不一樣的東西:如果你可以直接說話給 AI 聽,就像跟朋友聊天一樣呢?

2023 年底,OpenAI 給了 ChatGPT 一個聲音。你可以打開手機上的 app,按一個按鈕,就可以跟它進行真正的語音對話。你可以在煮晚餐的時候問它問題。你可以用它練習說外語。你甚至可以請它說一個睡前故事——它真的會用溫暖、自然的聲音說出來。

但這只是開始。OpenAI 接著教他們的 AI 看見東西。你可以把手機鏡頭對準作業上的數學題,AI 就會解釋怎麼解。你可以給它看花園裡的一棵植物,它會告訴你那是什麼植物。你可以拍一張外語菜單的照片,它會立刻翻譯。

一個能讀、能寫、能看、能聽、能說話的 AI。幾年前,這聽起來像科幻小說。現在它是真實的,就在數百萬人的口袋裡。

DALL-E:會創作藝術的 AI

OpenAI 不只停在文字上。他們打造了一個叫 DALL-E 的東西——一個能從文字創造圖片的 AI。

你可以打「一隻穿太空衣的貓,漂浮在地球上方,水彩畫風格」——DALL-E 就會創造出那張圖片。它以前從來不存在。沒有任何畫家畫過它。AI 想像了它然後畫了出來,全部只花幾秒鐘。

然後來了 Sora——一個能創造影片的 AI。你可以描述一個場景,像「一隻金毛小狗在雪地裡慢動作玩耍」,Sora 就會生成一段逼真的影片。

這些工具打開了一個全新的世界。一個不會畫畫的小朋友,現在可以為學校報告創造漂亮的插圖。一個請不起設計師的小企業主,可以做出專業的 logo。一個想像力豐富但預算很少的電影人,可以創造出本來要花幾百萬才能拍的場景。

AI 競賽

ChatGPT 成功之後,一件有趣的事發生了。

全世界的科技公司好像同時按下了「加速」按鈕。Google 趕緊推出自己的 AI 助手。Meta 也做了一個。大大小小的公司都在搶著把 AI 放進自己的產品裡。感覺就像一場賽跑——每個月都有人喊「我們的 AI 更厲害了!」

這讓 AI 的進步快到不可思議。一月份 AI 還做不到的事,到了六月就變成了基本功能。就像你玩一個遊戲,每次更新都多了一堆新能力。

接下來呢?

告訴你一件很瘋狂的事。AI 已經可以幫醫生在 X 光照片裡找到人眼可能漏掉的疾病。它可以幫科學家在幾個月內發現新藥,而不是花好幾年。它可以在兩個說不同語言的人對話的時候,即時翻譯——他們一邊說,AI 一邊翻。

而且它每個月都在變得更厲害。

Sam Altman 談過他最大的夢想:打造 AGI——Artificial General Intelligence(通用人工智慧)。意思是一個能像人類一樣學會任何事情的 AI。不只是回答問題或畫圖,而是真的能解決從來沒有人解開過的全新問題。想像一個 AI 能幫忙設計火星上的城市,或者找到把海洋裡的塑膠清乾淨的方法,或者發明一種永遠不會用完的新電池。

我們還沒到那裡。今天的 AI 在很多事上很厲害,但它有時候還是會犯傻傻的錯誤。它能寫出很美的詩,卻可能算錯 0.1 + 0.2 等於多少。它能解釋量子物理,卻不知道「被嚇到」是什麼感覺。

但最讓人興奮的是:AI 正在你眼前長大,而你剛好活在這個時代。當年在網路剛出現的時候長大的小孩,後來變成了打造 Google 和 Facebook 的人。現在長大的小孩——就像你——將會決定 AI 變成什麼樣子。

也許你會用 AI 做出一個沒有人想像過的遊戲。也許你會用它來幫助瀕臨絕種的動物。也許你會用它來破解海豚到底在跟彼此說什麼。

真正的問題從來都不是「AI 會做什麼?」而是:「你會用 AI 做什麼?」

你知道嗎?

  • ChatGPT 剛推出的時候,太多人同時在用,OpenAI 的伺服器經常被擠爆。網站三天兩頭就當機。
  • 到 2025 年,ChatGPT 已經支援超過 50 種語言,幫助全世界各地的人。
  • GPT-4 參加了美國的律師考試,成績排進前 10%。它也通過了 SAT 考試,分數比大部分高中生還高。

想一想!

  • 如果你有一個 AI 助手可以幫你學任何東西,你第一個想學的是什麼?
  • 你覺得 AI 最適合幫人做哪些事?哪些事不應該交給 AI?
  • 想像現在是 2040 年。你覺得 AI 會怎樣成為你日常生活的一部分?跟今天有什麼不同?