吳恩達談 AI 的未來:算力瓶頸、編碼革命與為何人人皆應學習程式設計
Roger’s Takeaway
吳恩達也算是對我早期研究AI的啟蒙者之一,他在這場訪談中,談到AI目前最大的價值在於編寫程式碼,與我的理解一致,現在AI編程一個週末能完成過去六個工程師半年才能做到的事情。
此外,他也認為每個人都應該學習coding加速自己的工作。
在開源與閉源方面,他認為開源模型的知識流通快速的多,而閉源模型則需要花費大量資金,且知識流通較慢。
這一點很有趣,因為雖然邏輯是這樣,之前看過Redhat為什麼無法做大的故事,忘記原文在哪裡了(一直換筆記軟體的缺點),我印象中,結論是當沒有適當的Incentive,即使開源社區有快速迭代的好處,但推進的速度也不一定真的很快,因為沒有具體的Owner,也因此,變成共有財的悲歌。
最好的方式,可能是部分開源,例如Google Android的形式,對於Google來說,Google很有動力維護和升級Android生態,然而純開源的軟體則不容易有人去Own。
最後,吳恩達也談到投入產出,他認為應用層的確有很多直得投入的面向,但是相對於產業上游,如果只是找應用場景,還不需要到投入100億這種規模,嘗試一個想法只需要100萬美元。我自己的理解是,這其實也表示目前沒看到一個足夠大的市場,以及足夠大的經濟利潤的AI應用值得投入。
摘要
Andrew Ng 探討了電力和半導體的瓶頸、AI 編碼助手的興起、美中 AI 發展的對比,以及為何對「AI 泡沫」的擔憂可能被誇大了。
講者簡介
吳恩達 (Andrew Ng) 生於 1976 年的英國倫敦,成長於新加坡並深受多元學術文化薰陶,在先後取得卡內基美隆、麻省理工與柏克萊博士學位後,於 2002 年 執教史丹佛大學,開啟了人工智慧學術奠基之路;2011 年 他創立 Google Brain 專案,透過著名的「識別貓臉」實驗讓深度學習震驚全球,隨即於 2012 年 共同創辦 Coursera,一手推動了全球 AI 教育的民主化浪潮;2014 年 他轉戰工業界擔任 百度 (Baidu) 首席科學家,引領自動駕駛與語音技術的商業落地,直至 2017 年 離職後陸續成立 DeepLearning.AI、Landing AI 與 AI Fund,完成了從學術先驅、科技巨頭高管到「AI 傳教士」的身份跨越,至今仍致力於將 AI 導入傳統產業並培育下一代人才。
Highlight
1.
如果我們看看價值的桶子在哪裡,其中一個巨大的價值桶子就是 AI 輔助編碼。我認為這讓人回想起一個更早的時代。在上一代,Google 主導了橫向訊息發現,比如網頁搜尋,但在網際網路建立時,還有很多垂直領域的空間。最終我們有了 Travelocity 和 Expedia 在旅遊領域的應用,很多公司在零售領域,很多公司在交通、社交媒體等領域。
我們現在看到的是,ChatGPT 擁有如此強大的消費者品牌,ChatGPT 似乎是新一代橫向訊息發現的主導者,儘管我認為 Gemini 透過控制 Android 和 Chrome 擁有通路優勢,也是一個重要的參與者。但如果這就是橫向訊息的歸宿,那麼仍有很大的空間建立許多垂直領域。其中一個明顯真正有價值的垂直領域就是 AI 編碼助手。雖然 Cloud code 我每天都在使用,我也很喜歡它,OpenAI Codex 也有很大的動能,但它顯然讓開發人員變得更加高效和多產,以至於需求直線上升,我們還要使用更多。
我發現令人興奮的一點是,我經常將 AI 編碼助手視為其他工作職能可能發生情況的預兆,隨著 AI 行銷工具變得更有效率,AI 招聘工具變得更有效率,AI 金融工具變得更有效率。我經常將 AI 編碼助手視為隨著工具對其他部門也變得更好時可能發生情況的預示。
2.
在軟體工程的情況下,它是加速程式碼的編寫。有太多專案過去需要六名工程師花半年時間才能建立,今天我自己或是我的工程師可以在一個週末內建立起來。
3.
我認為每個人都應該學習 coding。我所看到的是,對於許多不只是軟體工程的工作角色,會 coding 的人比不會 coding 的人能完成更多工作。例如,我的行銷人員想要進行用戶調查,她想要讓人們提供即時反饋。她在 App Store 找不到任何東西,所以她說,你知道嗎,我要花兩天時間寫程式碼。這確實花了兩天時間,但我的行銷人員隨後建立了一個小型的行動應用程式,用戶可以左右滑動來對我們想要測試的一些行銷訊息提供反饋。因為這樣,我們能夠進行用戶實驗,獲得反饋,這幫助她作為行銷人員做得更好。相比之下,一個無法編寫小應用程式讓與人們互動並提供反饋的行銷人員,就無法做到這一點,無法獲得反饋,無法前進。
4.
China 的 AI 最終會比美國的 AI 更開放。事實證明,開放性對於一個國家的發展非常有利。當一個團隊發布 Open Source 軟體時,知識向附近社區的流通速度要快得多。所以我看到的是,當 China 的一個團隊發布一個 Open Weight 模型時,是的,美國人當然可以利用它,但 China 經濟從中受益更多,因為一旦東西是開放的,團隊之間更容易互相打電話說:「嘿,夥計,這到底是怎麼運作的,我在這個模型部分遇到了麻煩。」知識的流通對於創新非常有價值。當美國有更多封閉模型,而團隊試圖支付這些一億美元的薪水來挖掘人才時,知識的流通變得非常緩慢,這減緩了美國和歐洲創新的速度。
5.
事實證明,因為我們花了數十億美元來訓練這些 AI 模型,我們現在可以用幾百美元或幾千美元或幾十美元來存取它們。建立大量以前不可能的應用程式真是太棒了。從 VC 投資的角度來看,嘗試某件事的成本如此之低,以至於想法較少,不確定在哪裡投入大量資本在應用層工作。事實上,如果你看很多應用層的投資,有時感覺像是公司投入了一億美元,以便他們可以支付 OpenAI 或 Anthropic,這樣 OpenAI 或 Anthropic 就可以支付 Nvidia,這就是所有錢最終去的地方。
儘管如此,在應用層仍有許多有價值的賭注。但困境是,你可以用非常資本有效的方式做到這一點。所以如果有人想說,「我想投入 100 億美元工作」,是的,你可以建立價值 100 億美元的 Data Centers,我們知道如何花這筆錢。但是你如何花 100 億美元來建立應用程式呢?問題幾乎是,嘗試一個想法只需要一百萬美元,所以我如何花 100 億美元?這既是一個問題,也不是一個問題,但我認為我們應該繼續投資。
我對 AI 的邊際利潤(Margins)問題有一些看法。我看到許多軟體應用程式的初期萌芽,構建成本並不那麼昂貴,而且如果你對 LLM Token 的使用不是你開支的大部分,那麼經濟效益是可行的。如果看看像 Replit 或 Lovable,他們 80% 的傳輸是給 Anthropic 的。我感到興奮的動態是,隨著 LLM Token 成本持續下降,我們將看到經濟學如何變化。現在 Token 只是昂貴,但希望這會改變,創造的價值是巨大的。
逐字稿
AI 發展的瓶頸:電力與半導體
在我從事 AI 工作的職業生涯中,我從未遇過任何一位 AI 從業者覺得他們擁有的算力是足夠的。給我任何數量的算力,我們都會將其耗盡,然後說我們仍然不夠用。這一直是過去 20 年來的限制。但我現在看到的是,隨著 GenAI 的興起,有一些非常有價值的工作負載出現了。例如 AI 輔助編碼,這太棒了,它讓我們的工作效率大大提高。但是如果你大量使用雲端程式碼,有時會受到速率限制,我發現許多公司確實存在需求過剩的問題,這是一個很少見的問題,但這麼多人想要更多的 LLM 推論,想要生成更多的 Token,而我們只有這麼多的 Semiconductor、Data Centers 和電力來滿足需求。但在短期內,電力和 Semiconductor 確實存在一些限制。
如果我們看看美國和一些西方國家,一旦我們為了這一代人建立了道路和鐵路作為基礎設施,Data Centers 就是建立數位經濟的關鍵基礎設施。而在美國,我確實擔心許多 Data Center 營運商會陷入許可證的困境。我知道當地社區的支持很重要,有些人不希望 Data Center 建在那裡,但這對國家建設至關重要。相比之下,我看到 China 到處建設發電廠,包括核電,這將是一個有趣的動態。然後 Semiconductor 是另一個瓶頸。但 AI 是如此複雜,我認為我們也需要更多的數據,我們也需要更好的演算法,所有這些都值得努力,但在短期內,電力和 Semiconductor 確實存在一些限制。
對算力的渴求與 AI 編碼助手
雖然 Token 生成變得更有效率且更便宜,如果你看看 OpenAI 的 open weight 模型,他們發布的模型運行起來非常有效率。我認為他們做得很好,雖然 Token 生成的成本在下降,但我們對它的需求是無法滿足的。AI 發生的一件有趣的事情是,如果我們看看價值的桶子在哪裡,其中一個巨大的價值桶子就是 AI 輔助編碼。我認為這讓人回想起一個更早的時代。在上一代,Google 主導了橫向訊息發現,比如網頁搜尋,但在網際網路建立時,還有很多垂直領域的空間。最終我們有了 Travelocity 和 Expedia 在旅遊領域的應用,很多公司在零售領域,很多公司在交通、社交媒體等領域。
我們現在看到的是,ChatGPT 擁有如此強大的消費者品牌,ChatGPT 似乎是新一代橫向訊息發現的主導者,儘管我認為 Gemini 透過控制 Android 和 Chrome 擁有通路優勢,也是一個重要的參與者。但如果這就是橫向訊息的歸宿,那麼仍有很大的空間建立許多垂直領域。其中一個明顯真正有價值的垂直領域就是 AI 編碼助手。雖然 Cloud code 我每天都在使用,我也很喜歡它,OpenAI Codex 也有很大的動能,但它顯然讓開發人員變得更加高效和多產,以至於需求直線上升,我們還要使用更多。
我發現令人興奮的一點是,我經常將 AI 編碼助手視為其他工作職能可能發生情況的預兆,隨著 AI 行銷工具變得更有效率,AI 招聘工具變得更有效率,AI 金融工具變得更有效率。我經常將 AI 編碼助手視為隨著工具對其他部門也變得更好時可能發生情況的預示。
程式設計的未來與人才需求
在軟體工程的情況下,它是加速程式碼的編寫。有太多專案過去需要六名工程師花半年時間才能建立,今天我自己或是我的工程師可以在一個週末內建立起來。我希望我們再也不需要在沒有 AI 助手的情況下編寫程式碼,因為這種加速、生產力的提升是令人難以置信的。例如,一個週末我想給女兒做些閃卡來練習乘法。她想練習乘法,她想要閃卡。我想我可以開車去商店給她買一堆閃卡,或者我就用 AI 幫我寫程式碼,生成並列印出一堆閃卡。所以我做了後者。這是一個經濟價值很低的任務,但是有了 AI 輔助編碼,我可以很快完成。
至於這是否意味著我們不需要工程師了?我認為我們需要所有這些人。我對「vibe coding」這個詞的感覺很複雜,撇開術語不談,我認為每個人都應該學習 coding。我所看到的是,對於許多不只是軟體工程的工作角色,會 coding 的人比不會 coding 的人能完成更多工作。例如,我的行銷人員想要進行用戶調查,她想要讓人們提供即時反饋。她在 App Store 找不到任何東西,所以她說,你知道嗎,我要花兩天時間寫程式碼。這確實花了兩天時間,但我的行銷人員隨後建立了一個小型的行動應用程式,用戶可以左右滑動來對我們想要測試的一些行銷訊息提供反饋。因為這樣,我們能夠進行用戶實驗,獲得反饋,這幫助她作為行銷人員做得更好。相比之下,一個無法編寫小應用程式讓與人們互動並提供反饋的行銷人員,就無法做到這一點,無法獲得反饋,無法前進。
今天我最好的招聘人員,不僅是手動篩選履歷,他們正在寫 prompts 讓 AI 幫助他們篩選履歷。這就是為什麼我認為我們仍然需要人類來做很多工作。AI 很棒,但有很多事情它做不到。所以那種認為我們會擁有 Phantom AGI,有一天有了 AI 就能做人類能做的一切的想法,我認為我們離那還很遠,可能有幾十年甚至更長。訣竅在於,如果 AI 可以完成招聘人員 30% 的工作,或者也許 50%,雖然這感覺有點高,但還有另外 50% 到 70% 的工作仍然需要人類來做。但也許很清楚的是,如果你使用 AI 而某人沒有,這在你能完成的事情上會有巨大的差異,所以最好使用 AI。因為 AI 不能做所有事情,所以對於許多知識型工作者的角色,我們仍然需要人類來做大量的工作。
美中 AI 競賽與監管政策
過去幾年,美國聯邦政府做了一些好事,也做了一些沒那麼有幫助的事。我覺得清除不必要的法規是一個非常好的舉措。甚至在去年,兩黨合作的 Schumer AI Insight Forum,我認為有很多人遊說美國政府通過令人窒息的法規。有很多被炒作的 AI 安全敘事,說 AI 可能導致人類滅絕,我認為這是一種荒謬的說法。試圖通過令人窒息的反競爭法規,通常是為了試圖關閉 Open Source 和 Open Weight。幸運的是我們擊退了很多這樣的做法,我認為 Schumer Insight Forum 做得很好,挖掘真相,並得出結論認為美國應該投資 AI,而不是通過不必要的法規來減緩它的發展。
我認為 Trump 及其團隊,David Sacks 和 Krishna 等人,在清除不必要的法規方面做得很好。另一方面,美國巨大的競爭優勢之一是吸引人才的能力,包括高中人才,以及可能目前還不是高技能但未來可能成為高技能的年輕人才。如果美國不投資於吸引人才,我認為這將是一個非受迫性失誤。最後,對科學的投資。希望我們的高等教育機構有資源來培訓我們的研究生,投資於科學和技術,我認為這真的很珍貴,任何損害這一點的事情我也認為是非常不幸的。
美國有幸擁有許多非常聰明的人想要來到這裡,解決真正具有挑戰性、艱難的問題。我們的許多諾貝爾獎得主都是移民。愛因斯坦就是典型的例子。我認為繼續培養美國作為一個吸引偉大人才的地方,在一個尊重法治的民主國家共同努力,這將幫助我們前進。
開源模型的地緣政治影響力
如果我們看看 Open AI 的 Open Weight 模型,他們發布的模型運行起來非常有效率。關於 Open 與 Closed 的問題,這仍然是非常動態的。對於許多美國公司來說,領先的前沿模型通常保持封閉,而低一級的模型雖然不如發布時的開放模型好,但也還不錯。我認為這比什麼都沒有好得多。我實際上感謝所有發布 Open Source Open Weight 模型的團隊。
另一個動態是 China,特別是 China 已經在發布大量非常好的 Open Weight 模型方面處於領先地位或達到了很高的水平。我會說,這有點不像我十年前預測的那樣,China 的 AI 最終會比美國的 AI 更開放。事實證明,開放性對於一個國家的發展非常有利。當一個團隊發布 Open Source 軟體時,知識向附近社區的流通速度要快得多。所以我看到的是,當 China 的一個團隊發布一個 Open Weight 模型時,是的,美國人當然可以利用它,但 China 經濟從中受益更多,因為一旦東西是開放的,團隊之間更容易互相打電話說:「嘿,夥計,這到底是怎麼運作的,我在這個模型部分遇到了麻煩。」知識的流通對於創新非常有價值。當美國有更多封閉模型,而團隊試圖支付這些一億美元的薪水來挖掘人才時,知識的流通變得非常緩慢,這減緩了美國和歐洲創新的速度。
除了增加創新和知識流通(這對 Open Weight 模型有幫助)之外,我認為 Open Weight 模型也是地緣政治影響力的巨大來源。例如,如果有一天,某個開發中國家的孩子問了一個關於政治敏感話題的問題,或者問「在這種情況下國家邊界在哪裡?」或者「這個事件或那個事件的歷史是什麼?」他們最終使用的模型的原產國將提供某種答案。答案是否偏向一個國家的價值觀或另一個國家的價值觀,實際上是影響力和軟實力的巨大來源。不管你喜不喜歡,Open Weight 模型是 AI 供應鏈的關鍵部分,China 發布低成本或免費的模型進入該關鍵供應鏈,意味著它真的開始建立領先優勢,並建立一個龐大的用戶群。這就是為什麼擁有強大媒體和娛樂產業的國家,如南韓,擁有不成比例的影響力,因為人們聽 K-pop 或其他東西,這為國家買來了很多影響力。Hollywood 是美國軟實力的巨大來源,描繪了美國夢的某種願景,談論自由和民主的價值觀,這是溝通和軟實力的另一個前沿。
歐洲的監管挑戰
如果我對歐洲監管機構有一個願望,那就是停止過度監管,專注於投資和建設。我聽到這樣的話:「我們想成為監管 AI 的領導者」,並認為這是我們的競爭優勢。恕我直言,這不是競爭優勢。我對歐洲的一個願望是停止過度監管,讓那些想努力工作的人努力工作,不要強迫他們不努力工作,就去投資和建設東西。事情是,AI 的日子還很早,比賽還很早。歐洲有很多聰明人。
AI 投資與泡沫論
有大量的資金投入到 Data Centers 和 Infra。我們可以爭論是否存在泡沫。我們肯定需要大量的投資。我們是否達到了人們使用如此深奧的金融工具來尋找現金的地步,以至於會出現泡沫?我們可以爭論這一點。但我們肯定需要大量的投資,但何時會變成過度投資,這是一個有趣的問題。另一個我們需要大量投資的地方不僅是 Infra、Data Center、Foundation Model 層,還有應用層。
事實證明,因為我們花了數十億美元來訓練這些 AI 模型,我們現在可以用幾百美元或幾千美元或幾十美元來存取它們。建立大量以前不可能的應用程式真是太棒了。從 VC 投資的角度來看,嘗試某件事的成本如此之低,以至於想法較少,不確定在哪裡投入大量資本在應用層工作。事實上,如果你看很多應用層的投資,有時感覺像是公司投入了一億美元,以便他們可以支付 OpenAI 或 Anthropic,這樣 OpenAI 或 Anthropic 就可以支付 Nvidia,這就是所有錢最終去的地方。
儘管如此,在應用層仍有許多有價值的賭注。但困境是,你可以用非常資本有效的方式做到這一點。所以如果有人想說,「我想投入 100 億美元工作」,是的,你可以建立價值 100 億美元的 Data Centers,我們知道如何花這筆錢。但是你如何花 100 億美元來建立應用程式呢?問題幾乎是,嘗試一個想法只需要一百萬美元,所以我如何花 100 億美元?這既是一個問題,也不是一個問題,但我認為我們應該繼續投資。
我對 AI 的邊際利潤(Margins)問題有一些看法。我看到許多軟體應用程式的初期萌芽,構建成本並不那麼昂貴,而且如果你對 LLM Token 的使用不是你開支的大部分,那麼經濟效益是可行的。如果看看像 Replit 或 Lovable,他們 80% 的傳輸是給 Anthropic 的。我感到興奮的動態是,隨著 LLM Token 成本持續下降,我們將看到經濟學如何變化。現在 Token 只是昂貴,但希望這會改變,創造的價值是巨大的。
代理工作流與未來的應用
我們現在看到的是有用的代理(Agentic)工作流。AI Fund 的團隊已經為許多任務建立了許多 Agentic 工作流,我們以前無法完成這些任務,但現在有了 Agentic 工作流就可以做到。例如,一年前,我們認為關稅合規可能成為一個問題,結果不幸我們是對的。所以去年我們開始探索建立技術來幫助關稅合規。我們建立了 Agentic 工作流來仔細閱讀關稅合規文件,獲取某人想要進口的規格,嘗試匹配,提出建議。這是我們現在的一家投資組合公司,叫做 Guyer Dynamics。如果沒有 Agentic 工作流,我們根本無法做到這一點。
我們有在印度運作的醫療助手,AI 助手 Caldus 幫助處理法律文件。如果不使用這些 AI Agents,我們就無法完成許多工作負載。我發現今天已經有有用的 AI Agentic 工作流。大型企業也是如此,不僅僅是我們的新創公司。當我看到 Hyper-scalers 並與朋友交談時,我看到大型企業內部有一堆工作流,如果沒有這些 AI Agents,我們就無法做到。
模型的大小與多樣性
我們會有大型模型、中型模型和微型模型。我對此充滿信心的原因是智慧的本質是多樣化的。有時候我們做智力上非常簡單的任務,比如昨天我女兒拼錯了「蝴蝶」這個詞,所以我需要告訴她如何拼寫蝴蝶。這是一個低級的智力任務。有時候我坐下來思考幾個小時關於某個複雜的技術問題,這真的很難。所以智慧有一系列的任務我們想做,我們希望 AI 也能做,這有巨大的範圍。
如果你想讓 AI 做基本的語法檢查和拼寫檢查,你不需要一個萬億參數的模型。使用一個微型模型,也許在本地運行就可以了。但如果你想讓它進行複雜的推理來編寫一段程式碼,那麼是的,擁有一個強大的模型會做得更好。我實際上非常有信心,我們最終會擁有一系列的模型,大大小小的,來完成各種任務。就像我們讓人類做各種難度的任務一樣,AI 也是如此。
給教育機構與未來的建議
我給教育機構的最大建議是擁抱它,更新課程,盡可能多地教學生 AI。學生將生活在一個他們會使用 AI 並讓 AI 幫助他們的世界。你必須教學生這樣做。我認為這對不同的領域會有不同的影響,但有一件事是明確的:讓所有的學生都學習 coding。
我對未來的願景是,智慧是當今世界上最昂貴的東西之一。這就是為什麼在美國,聘請一位高技能的醫生來為我們的醫療狀況提供建議是如此昂貴。或者聘請一位高技能的導師來耐心地教導我們的孩子是如此昂貴。因為那種智慧,訓練那位明智的醫生、明智的老師、明智的顧問是非常昂貴的。但有了 AI,我們終於有一條路徑讓智慧變得便宜。所以在未來,如果每個人都可以得到一群聰明、消息靈通的員工在陽光下的所有話題上提供協助,而目前只有社會上相對富有的人才能負擔得起聘請這些人,那麼個人將被賦予更大的權力,能夠完成更多的事情,生活將會如此不同,GDP 的增長將會是巨大的。
所以,儘管有炒作,儘管有泡沫的擔憂,我對我們能建設什麼以及這將如何賦予世界各地的人們權力感到非常樂觀。