Fei-Fei Li Helped Create AI, Now She Feels the Responsibility

Youtube Link

Roger’s Takeaway

這是我看李飛飛近期的第四場演講,本次演講談空間智能比較少,更多是談她的過去,她的志願與性格。

能感受到,李飛飛從厲害的物理學家開始,藉由閱讀他們提出的大問題與解決方法,李飛飛也開始找自己的大問題,因此她挑選智能,開始研究智能是如何產生?如何建構智能機器。

為此,她觀察人類的大腦與腦神經,學習機器學習。試圖從人類的模式找到靈感,最終,這個靈感是視覺。

她在此次訪談中提到《WordNet》這本英語字典,他發現在字典中,蘋果 (apple) 和家電 (appliance) 非常接近,但現實生活卻不然,然而人類卻可以很好的處理這些問題。人類體驗世界時,伴隨著大量的數據處理,而且人類處理的很好。

觀察李飛飛的生涯,我看到的是她的人生非常專注,且想在未知的領域前進,跟她所嚮往的物理學家一樣,挑戰未知的大問題。

非常令人Inspire,反思我自己,儘管對我來說,我更多是研究生意與產業,但可以說,我還沒有能力挑戰人類能力的邊界,我也應該更努力的理解AI,以及他能在這個實體創造的影響,見證這個人類下一次的躍遷。

摘要

Fei-Fei Li 分享了她從移民乾洗店經營者到成為「AI 教母」的歷程。她探討了 ImageNet 的創立、她的新公司 World Labs 對空間智能的願景,並回應了關於 AI 安全、工作機會流失以及人類能動性重要性的議題。

Highlight

1.

這是一個好問題,因為 AI 對我來說並不新鮮。我在這個領域已經 25 年了。從職業生涯開始,我每天都與它共存。然而,就其巨大而深遠的影響而言,這一刻對我來說仍然令人生畏,甚至有點超現實。

這是一種文明級別的技術,對我個人而言之所以超現實,是因為我是促成這一切發生的科學家群體中的一員。顯然,我沒有預料到它會如此巨大。

2.

我成長在中國一個不太知名的地方。我來自一個小家庭。所以妳可以說生活在某種意義上是渺小的。一個小家庭,城市也不大。那是 80 年代,我的童年相當簡單且封閉。

而物理學幾乎是相反的。它是浩瀚的,是大膽的。想像力是無限的。妳仰望天空,可以思考宇宙的起源。妳看一片雪花,可以放大到物質的分子結構。妳思考時間,思考磁場,思考核能。它將我的想像力帶到了在這個世界上永遠無法到達的地方。而直到今天,物理學真正讓我著迷的是提出大膽的問題。

讓我們不要害怕對我們的物理世界、宇宙、我們來自哪裡提出最大膽的問題。

3.

我認為這植根於我對物理學的熱愛以及我在物理學方面的訓練,我觀察我欽佩的每一位物理學家,從牛頓到麥克斯韋,到薛丁格,再到愛因斯坦,我最喜歡的物理學家,看他們提出的大膽問題。我想找到我自己的大膽問題。在大學期間的某個時候,我的大膽問題從物理物質轉向了智能。它是什麼,它是如何產生的?最令人著迷的是我們如何構建智能機器?這成為了我的探索,我的北極星。

這是一個巨大的飛躍,因為從進行計算和運算的機器,妳實際上是在談論會學習且不斷學習的機器。

人類在識別世界物體方面擁有的變異性和多樣性是基礎。有許多神經科學研究支持這一點。所以我決定那是我的第一個北極星,我的博士論文就是構建機器演算法,當時我們稱之為機器學習演算法,以識別儘可能多的物體。

4.

在前沿做科學的美妙之處。因為它是新的。沒有人知道該怎麼做。作為 AI 科學家,妳會尋找可能的答案,而且很自然地會去觀察人腦和人類心智,試圖理解或從人類能做的事情中獲得靈感。我在研究早期或試圖解鎖這個視覺智能問題時獲得的靈感之一是,觀察我們的視覺語義空間是如何構建的。世界上有成千上萬甚至數百萬的物體。它們是如何組織的?它們是按字母表組織的,還是按大小或顏色組織的?

5.

我偶然發現了一個名為 WordNet 的語言學著作。WordNet 是一種組織語義概念的方式,不是視覺的,只是語義,或者說是特定分類法中的詞彙。

一個例子是,在字典中,蘋果 (apple) 和家電 (appliance) 非常接近。但在現實生活中,蘋果和梨子彼此更接近。蘋果和梨子都屬於水果,而家電屬於完全不同的物體家族。我偶然發現了這個名為 WordNet 的分類法,它描述了物體的這種組織方式,我在腦海中建立了一個聯繫,有兩件事非常清楚。

一是這可能是視覺概念組織的方式。因為蘋果和梨子的聯繫比蘋果和洗衣機的聯繫緊密得多。但也更重要的是規模。如果妳看看語言描述的物體數量,妳會意識到它是多麼巨大。這對我來說是一個特別的點,即要識別世界,作為智能動物、作為人類,我們體驗世界時伴隨著大量的數據。而我們不知何故處理了這一切。並且也學會了這一切。我們需要賦予機器這種能力。

6.

本世紀初,「大數據」的概念其實並不存在。不,「大數據」這個詞組不存在。沒有人談論數據驅動的機器學習,我們當時使用的科學數據集非常小。

我那個時代的大多數研究生使用的是包含 4 個或 6 個,最多 20 個物體類別的數據集。每個類別最多只有幾百個例子,就是這麼小。然而快轉三年後,在我們創建了 ImageNet 之後,它擁有 22,000 個物體類別和 1500 萬張標註圖像。

7.

我在 15 歲時來到美國,住在新澤西州的 Parsippany。我們所有人,我的父母和我都不太會說英語。我還年輕,學得比較快。這對我的父母來說非常困難,我們的經濟狀況非常不好。我父母做收銀員的工作,後來,我在進入大學時也在餐館打工。另外,我媽媽的健康狀況不太好。所以,我和家人決定在新澤西經營這家小乾洗店來賺錢生存。

我是會說英語的人。所以我接聽所有客戶電話,處理帳單,處理所有檢查和業務。

8.

我確實認為中國是 AI 強國。我認為美國是——我想在這一刻,大多數人都會承認,AI 領域的兩個領先國家是中國和美國。我認為英國也是 AI 領域一個非常強大的參與者。我確實環遊世界。我認為世界上許多地區和國家希望在 AI 中佔有一席之地,希望在 AI 的某些領域趕上甚至領先的興奮、活力以及坦率地說的野心,是相當普遍的。

9.

空間智能是 AI 或坦白說任何智能理解、感知、推理和互動以及創造空間、世界的能力。它是視覺智能的延續

正如我所說,我的職業生涯始於視覺智能,我職業生涯的前半段,大約在 ImageNet 時期,試圖解決僅僅理解我們所看到的這一基本問題。那是一個非常重要的問題。

但這還不夠,因為那是一種非常被動的行為。它只是接收訊息並能夠理解這是一個杯子,這是一位美麗的女士,這是一個麥克風。但如果你看進化,看人類智能,感知與行動有著深刻的聯繫。我們看是因為我們移動。我們移動,因此我們需要看得更清楚。

而這種聯繫,妳如何創造這種聯繫與空間有很大關係,因為妳需要看到 3D 空間。妳需要了解物體在世界上是如何移動的。妳需要了解當我觸摸這個杯子時,我如何數學地組織我的手指,以便創造一個空間讓我能夠抓住這個杯子。所有這些複雜性都集中在空間智能這種能力周圍。

10.

Marble 是一個前沿模型。它是一個前沿世界模型。它的作用不僅僅是看和進入一個世界,真正了不起的是它能通過簡單的提示生成一個 3D 世界。提示可以是「給我一個現代外觀的廚房」。或者提示可以是「這是一張現代外觀廚房的照片,把它變成一個 3D 世界」。甚至可以是「這是幾張現代外觀廚房的照片,確保為我創建一個連貫的現代外觀廚房」。妳可能會問為什麼?實際上有很多用例。

首先,創建 3D 世界的能力是一種基本能力。它對人類來說是基本的,我希望有一天對 AI 來說也是基本的

其次,如果你是設計師或建築師,妳可以使用這個 3D 世界來構思、設計。

如果你是遊戲開發者,因為它是 3D 的,妳可以使用它來創建很多遊戲。現在要獲得這些 3D 世界非常痛苦。

如果你是視覺特效製作人或藝術家,妳可以用它來製作電影。如果你想做機器人模擬,這些世界將成為機器人非常有用的訓練數據或評估數據。

如果你想在 AR/VR 中創造沉浸式教育體驗,這個模型將幫助妳做到這一點。

所以它實際上具有令人難以置信的橫向用途。

或者我在想像,例如,妳如何向一個八歲的孩子解釋什麼是細胞?有一天我們將創造一個細胞內部的世界。

11.

技術確實會改變勞動力的格局。像 AI 這樣具有影響力和深遠意義的技術將對工作產生深遠的影響。

Salesforce 表示他們 50% 的客戶支持職位將因為 AI 而消失。

沒錯,還有軟體工程、聯絡中心、分析師工作。所以毫無疑問。

12.

我認為定論尚早。每當人類創造出一種更先進的技術,例如蒸汽機、電力、個人電腦、汽車,我們都經歷過困難時期,但也經歷了工作版圖的重新規劃。所以只談論數字變大或變小並不公平。我們需要以更細緻的方式看待這個問題,真正思考如何應對這種變化。有個體層面的責任。妳必須學習,妳必須提升自己的技能。但也有公司層面的責任。也有社會層面的責任。所以這是一個很大的問題。

13.

我意識到我的責任。我明白我是將這項技術帶給我們世界的人之一。我明白我很榮幸能夠在世界上最好的大學之一工作,教育明天的領導者並進行前沿研究。我意識到自己是一位企業家,也是生成式 AI 世界中最令人興奮的初創公司之一的 CEO。所以我所做的一切都有後果。這是我肩負的責任。我非常認真地對待這一點,因為這就是我一直告訴人們的,在 AI 時代,能動性應該在人類身上。能動性不在機器身上,而在我們身上。我的能動性是創造令人興奮的技術並負責任地使用它。

逐字稿

關於過去幾年 AI 如何改變我們生活的起源故事是什麼?你即將聽到的對話是與一位見證這一切的人進行的。她在這項變革性技術的發展過程中,扮演了真正具變革性的角色。

她被稱為 AI 教母,但我認為這並不能完全涵蓋她所做出的貢獻。坦白說,我認為她的工作應該更廣為人知。她是一位科學家、教授、科技公司 CEO,也是一位在生活中歷經艱辛的人。

她 15 歲時從中國搬到美國,當時幾乎不會說英語,後來經營父母的乾洗店業務,以幫助家庭維持生計。以下是我在 The Mishal Husain Show 與 Fei-Fei Li 博士的對話。

Fei-Fei Li 博士,感謝妳來到節目中。我想從妳所在行業這段非凡的時期開始談起。距離 ChatGPT 向公眾發布已經三年了,從那時起,出現了新的載體、新的應用程式,以及大量資金湧入這個行業。這個時刻對妳來說感覺如何?

首先,Mishal,謝謝妳邀請我上這個節目。非常興奮。

這個時刻對我來說感覺如何?這是一個好問題,因為 AI 對我來說並不新鮮。我在這個領域已經 25 年了。從職業生涯開始,我每天都與它共存。然而,就其巨大而深遠的影響而言,這一刻對我來說仍然令人生畏,甚至有點超現實。

在我看來這是千真萬確的。這是一種文明級別的技術,對我個人而言之所以超現實,是因為我是促成這一切發生的科學家群體中的一員。顯然,我沒有預料到它會如此巨大。

改變的時刻是什麼時候?因為我知道妳談過那些被稱為 AI 寒冬的歲月,而妳現在描述這一刻即使對妳來說也感覺非比尋常。是因為發展的速度,還是因為世界已經覺醒並因此將聚光燈轉向像妳這樣的人?

我認為這兩者是交織在一起的。但對我來說,將其定義為一種文明技術與聚光燈無關。這甚至與它有多強大無關,而是關於它影響了多少人。歸根結底,技術的終點是它對人的影響。我稱之為文明時刻,是因為每個人的生活、工作、福祉和未來都會以某種方式被 AI 觸及或影響。

有壞的方面也有好的方面嗎?

技術是一把雙面刃。我認為兩方面都有,因為自人類文明破曉以來,我們創造了稱為技術的工具。這些工具通常是為了做好事而設計的。但在過程中,我們可能會以錯誤的方式使用它,我們可能會故意以錯誤的方式使用它,或者我們可能會產生意想不到的後果。

是的。我知道在這個對話過程中,這方面的議題會以不同的方式出現。但妳提到了「權力」這個詞,這項技術的權力掌握在極少數公司手中,其中大多數是美國公司,這讓我感到震驚。妳對此有何看法?

妳是對的。主要的科技公司掌握了太多的技術本身。通過其大規模覆蓋的產品,他們正在全球範圍內對我們的社會產生最大的影響。我個人希望看到這項技術變得更加民主化。我希望看到無論是誰構建或掌握這項技術的深遠影響力,都能以負責任的方式進行。我也相信在這個時代,每個人都應該覺得自己有能力去影響這項技術。

我們稍後會再多談一點。我想談談民主化以及如何實現這一點,但當然,就該領域的公司而言,妳也是其中的一部分,因為妳既是學者又是科技公司 CEO。事實上,我認為妳那家非常年輕的公司,成立僅一年多,據報導價值已經達到數十億美元。

是的。我是 World Labs 的聯合創始人兼 CEO,我們成立一年多了,正在構建 AI 的下一個前沿,即空間智能,今天人們對此聽得不多,因為大家都在關注大型語言模型。但我相信空間智能與語言智能一樣關鍵且互補。

這個虛擬世界的概念,我們稍後會深入探討。但在那之前,我想請妳帶我們回到妳見證了這個行業整個發展軌跡的事實。妳已經在其中耕耘了 25 年。我知道妳最早在學術上的熱愛是物理學。是妳最欽佩的物理學家生活或工作中的什麼因素,讓妳思考超越那個特定領域?

這是一個很好的問題。我成長在中國一個不太知名的地方。我來自一個小家庭。所以妳可以說生活在某種意義上是渺小的。一個小家庭,城市也不大。那是 80 年代,我的童年相當簡單且封閉。

妳是獨生女,這在中國一胎化政策下是很常見的。

我的家庭總體來說很小。而物理學幾乎是相反的。它是浩瀚的,是大膽的。想像力是無限的。妳仰望天空,可以思考宇宙的起源。妳看一片雪花,可以放大到物質的分子結構。妳思考時間,思考磁場,思考核能。它將我的想像力帶到了在這個世界上永遠無法到達的地方。而直到今天,物理學真正讓我著迷的是提出大膽的問題。

讓我們不要害怕對我們的物理世界、宇宙、我們來自哪裡提出最大膽的問題。

但我認為妳的大膽問題是關於什麼是智能。

是的。我認為這植根於我對物理學的熱愛以及我在物理學方面的訓練,我觀察我欽佩的每一位物理學家,從牛頓到麥克斯韋,到薛丁格,再到愛因斯坦,我最喜歡的物理學家,看他們提出的大膽問題。我想找到我自己的大膽問題。在大學期間的某個時候,我的大膽問題從物理物質轉向了智能。它是什麼,它是如何產生的?最令人著迷的是我們如何構建智能機器?這成為了我的探索,我的北極星。

這是一個巨大的飛躍,因為從進行計算和運算的機器,妳實際上是在談論會學習且不斷學習的機器。

我喜歡妳用物理學的雙關語,量子飛躍 (quantum leap)。

是的。跨越到日常用語中。但我認為妳在思考智能時,是否有過一個靈光一閃的時刻,意識到其中的關鍵部分是我們識別周圍世界物體的能力?事實上,我們現在周圍有多個物體,我們知道它們是什麼。

識別大量物體的能力,人類在識別世界物體方面擁有的變異性和多樣性是基礎。有許多神經科學研究支持這一點。所以我決定那是我的第一個北極星,我的博士論文就是構建機器演算法,當時我們稱之為機器學習演算法,以識別儘可能多的物體。

我認為關鍵問題是如何做到?我覺得妳的背景非常有趣的是,妳閱讀非常廣泛,有兩個關鍵突破使妳的最終突破成為可能。一個是妳開始思考和學習與妳領域相關的心理學家和語言學家的觀點。告訴我這兩方面的情況。

這就是在前沿做科學的美妙之處。因為它是新的。沒有人知道該怎麼做。作為 AI 科學家,妳會尋找可能的答案,而且很自然地會去觀察人腦和人類心智,試圖理解或從人類能做的事情中獲得靈感。我在研究早期或試圖解鎖這個視覺智能問題時獲得的靈感之一是,觀察我們的視覺語義空間是如何構建的。世界上有成千上萬甚至數百萬的物體。它們是如何組織的?它們是按字母表組織的,還是按大小或顏色組織的?

妳問這個問題是因為妳必須了解我們的大腦是如何組織的,以便有東西可以教給電腦?

這是一種思考方式。我偶然發現了一個名為 WordNet 的語言學著作。WordNet 是一種組織語義概念的方式,不是視覺的,只是語義,或者說是特定分類法中的詞彙。

給我一個例子。

一個例子是,在字典中,蘋果 (apple) 和家電 (appliance) 非常接近。但在現實生活中,蘋果和梨子彼此更接近。蘋果和梨子都屬於水果,而家電屬於完全不同的物體家族。我偶然發現了這個名為 WordNet 的分類法,它描述了物體的這種組織方式,我在腦海中建立了一個聯繫,有兩件事非常清楚。一是這可能是視覺概念組織的方式。因為蘋果和梨子的聯繫比蘋果和洗衣機的聯繫緊密得多。但也更重要的是規模。如果妳看看語言描述的物體數量,妳會意識到它是多麼巨大。這對我來說是一個特別的點,即要識別世界,作為智能動物、作為人類,我們體驗世界時伴隨著大量的數據。而我們不知何故處理了這一切。

是的。不知何故我們處理了這一切。並且也學會了這一切。我們需要賦予機器這種能力。

因此妳需要大數據集。

是的。實際上值得注意的是,在那時,我想是本世紀初,「大數據」的概念其實並不存在。不,「大數據」這個詞組不存在。沒有人談論數據驅動的機器學習,我們當時使用的科學數據集非常小。

有多小?

例如在圖像方面,我那個時代的大多數研究生使用的是包含 4 個或 6 個,最多 20 個物體類別的數據集。每個類別最多只有幾百個例子,就是這麼小。然而快轉三年後,在我們創建了 ImageNet 之後,它擁有 22,000 個物體類別和 1500 萬張標註圖像。

ImageNet 是一個巨大的突破。這是妳被稱為「AI 教母」的原因。我很想了解更多關於妳的特質,是什麼讓妳能夠建立這些聯繫並看到其他科學家沒有看到的東西,我立刻想到的是妳搬到美國後將英語作為第二語言習得。這其中是否有某種因素導致了妳所描述的情況?

Mishal,這是一個很好的問題。我被問過這個問題,我真實的回答是,我不知道。人類的創造力仍然是一個謎。人們談論 AI 做所有事情,但我不同意。關於人類心智的奧秘,我們還有很多不知道的地方。所以我只能推測,是我的興趣和經歷的結合導致了這一切,包括好奇心和對定義大膽問題的渴望。我發現我不怕在科學上提出瘋狂的問題。

是的。

不怕尋求跳出框架的解決方案。也許我對語言與視覺聯繫的欣賞,因我自己學習不同語言的旅程而更加強化,但我不知道確切的答案。

作為青少年來到美國是什麼樣的感覺?因為我認為那是生活中一個特別困難的階段,需要搬家並結交新朋友。即使妳沒有面臨語言障礙。

那很艱難。作為一個移民,我在 15 歲時來到美國,住在新澤西州的 Parsippany。我們所有人,我的父母和我都不太會說英語。我還年輕,學得比較快。這對我的父母來說非常困難,我們的經濟狀況非常不好。我父母做收銀員的工作,後來,我在進入大學時也在餐館打工。另外,我媽媽的健康狀況不太好。所以,我和家人決定在新澤西經營這家小乾洗店來賺錢生存。

妳自己也參與了乾洗店的工作?

我現在開玩笑說當時我是 CEO。我經營了那家乾洗店七年。

從幾歲開始?

我 18、19 歲直到研究所中期。

所以一直貫穿大學和研究所。

是的,七年。

即使妳在遠方,妳也在經營妳父母的乾洗店生意。

是的。因為我是會說英語的人。所以我接聽所有客戶電話,處理帳單,處理所有檢查和業務。

這教會了妳什麼?

韌性。作為一名科學家,妳必須有韌性。因為科學是一段非線性的旅程。沒有人會有一個猜想,然後所有的解決方案就突然出現在面前。妳必須經歷挑戰才能到達並找到答案。而且,作為移民,妳學會了韌性。

妳的父母有推妳嗎?因為他們顯然希望妳有更好的生活。這就是為什麼他們離開中國去美國。這裡面有多少來自他們?又有多少來自妳自己對他們的責任感?

實際上,這是一個很好的問題。值得稱讚的是,他們並沒有怎麼推我。用今天的語言來說,他們不是虎爸虎媽。我想部分原因是老實說他們只是為了生存。尤其是我的媽媽,她骨子裡是個知識分子,她喜歡閱讀。但是,艱難的生存驅動的移民生活,加上她自己的健康問題,她根本沒有推我。我想,作為一個青少年,我某種程度上別無選擇。我要麼成功,要麼不成功,而且賭注相當高。所以我非常有自我驅動力。還有一件幸運的事是,我只是很好奇。我一直是個好奇的孩子,我的好奇心有一個出口,那就是科學,這真的讓我腳踏實地。我對夜總會或其他事情不好奇。我是科學的狂熱愛好者。

而且也是一位狂熱的讀者,從童年早期開始,妳就把兒童讀物放在一邊,轉向經典著作,如《簡愛》。大人的書。

我媽媽喜歡閱讀,她可能認為——妳說的是我九歲、十歲的時候。那時她可能有更多的影響。她認為我夠早熟,可以讀一些大人的書。

妳還有一位在妳生命中非常重要的老師。告訴我關於他的事。

我擅長數學,我也喜歡數學,我和班主任 Bob Sabella 先生,他是數學老師,成為了朋友。我們因為共同熱愛科幻小說閱讀而成為朋友,並且——

妳是用中文讀的。

當時我是用中文讀的。後來我開始用英文讀。但他是一個非凡的人,因為他可能在我身上看到了這種學習的渴望。所以他特地為我創造機會,讓我在數學上繼續表現出色。我記得我修完了最高級別的數學課程。所以沒有更多的課給我上了。他會利用午餐時間為我開設一對一的課程。現在我是成年人了,我知道他沒有額外的報酬。他這樣做不是為了贏得任何獎項。這真的完全出自一位老師的愛和責任感。他真的成為了我生命中非常重要的人。他和他的家人。

Sabella 先生還健在嗎?

Sabella 先生在我長大後,當我在史丹佛大學擔任助理教授時去世了。但他的家人,他的兩個兒子,他的妻子和我,我想他們現在就是我的新澤西家人。

妳用「愛」這個詞來形容他為妳所做的事。我想知道他們,他和他的家人是否也向妳介紹了美國社會。他們是妳的第一個朋友,也是通往學校以外整個美國世界的入口。

絕對是。他們向我介紹了典型的美國中產階級家庭。他們住在郊區的房子裡。他們有兩個可愛的孩子。當然,現在他們都結婚了,有了孫輩。但這對我來說是一個很好的窗口,讓我了解社會,腳踏實地,擁有朋友,並擁有一位關心我的老師。

妳認為妳能在中國擁有像現在這樣的職業生涯嗎?因為現在中國在 AI 方面也有重大進展?

我不認為我能回答這個問題,因為我認為生活充滿了機緣巧合。旅程會非常不同。某種程度上,我們可以模擬所有的可能性,但對於任何人來說,永恆或不變的是好奇心感,是對北極星的追求。所以如果還是我,我相信我仍然會以某種方式從事 AI 工作。

妳仍然覺得與中國有聯繫嗎?

這是我的傳統的一部分。我也感到非常幸運,我的職業生涯一直在美國高等教育和矽谷,也在產業界進進出出,身處科技領域。所有這些成分的結合是非常全球化的。感覺非常全球化。我的家人現在所處的環境,即史丹佛、舊金山、矽谷,是非常國際化的,所以我感覺更像是一個世界公民。我所處的學科非常橫向,它觸及各地的人們,所以在這一點上,我確實感覺更像是一個全球公民。

是的。當然,這是一個全球性的行業,但中國有一些真正引人注目的進步,尤其是專利數量和發表的 AI 公開論文數量,還有今年早些時候的 DeepSeek 時刻。展望本世紀,妳認為中國會在 AI 領域像在製造業等其他領域一樣趕上美國嗎?

我確實認為中國是 AI 強國。我認為美國是——我想在這一刻,大多數人都會承認,AI 領域的兩個領先國家是中國和美國。我認為英國也是 AI 領域一個非常強大的參與者。我確實環遊世界。我認為世界上許多地區和國家希望在 AI 中佔有一席之地,希望在 AI 的某些領域趕上甚至領先的興奮、活力以及坦率地說的野心,是相當普遍的。

是的。關於妳自己的下一個前沿,空間智能,當妳使用「空間智能」這兩個詞時,妳指的是什麼?妳現在正在研究什麼?

空間智能是 AI 或坦白說任何智能理解、感知、推理和互動以及創造空間、世界的能力。它是視覺智能的延續。正如我所說,我的職業生涯始於視覺智能,我職業生涯的前半段,大約在 ImageNet 時期,試圖解決僅僅理解我們所看到的這一基本問題。那是一個非常重要的問題。但這還不夠,因為那是一種非常被動的行為。它只是接收訊息並能夠理解這是一個杯子,這是一位美麗的女士,這是一個麥克風。但如果你看進化,看人類智能,感知與行動有著深刻的聯繫。我們看是因為我們移動。我們移動,因此我們需要看得更清楚。而這種聯繫,妳如何創造這種聯繫與空間有很大關係,因為妳需要看到 3D 空間。妳需要了解物體在世界上是如何移動的。妳需要了解當我觸摸這個杯子時,我如何數學地組織我的手指,以便創造一個空間讓我能夠抓住這個杯子。所有這些複雜性都集中在空間智能這種能力周圍。

我看過妳的網站,看到了妳發布的預覽 Marble,妳可以看到本質上是一個虛擬世界,人們可以進入其中,從一個房間到另一個房間,一扇門打開,妳從一個地方到另一個地方。但我不確定妳如何使用它。對妳來說,它本質上是一個訓練 AI 的工具,一種不同的訓練 AI 的方式嗎?而不是像 Meta 所說的這是元宇宙,這是人類可以進入並在其中消磨時間的世界。

好的。讓我們明確定義。Marble 是一個前沿模型。它是一個前沿世界模型。它的作用不僅僅是看和進入一個世界,真正了不起的是它能通過簡單的提示生成一個 3D 世界。提示可以是「給我一個現代外觀的廚房」。或者提示可以是「這是一張現代外觀廚房的照片,把它變成一個 3D 世界」。甚至可以是「這是幾張現代外觀廚房的照片,確保為我創建一個連貫的現代外觀廚房」。妳可能會問為什麼?實際上有很多用例。首先,創建 3D 世界的能力是一種基本能力。它對人類來說是基本的,我希望有一天對 AI 來說也是基本的。

其次,如果你是設計師或建築師,妳可以使用這個 3D 世界來構思、設計。如果你是遊戲開發者,因為它是 3D 的,妳可以使用它來創建很多遊戲。現在要獲得這些 3D 世界非常痛苦。如果你是視覺特效製作人或藝術家,妳可以用它來製作電影。如果你想做機器人模擬,這些世界將成為機器人非常有用的訓練數據或評估數據。如果你想在 AR/VR 中創造沉浸式教育體驗,這個模型將幫助妳做到這一點。所以它實際上具有令人難以置信的橫向用途。

有趣。我在想像阿富汗的女孩。也許妳可以在一個非常有挑戰性的地方進行虛擬課堂。

是的,或者我在想像,例如,妳如何向一個八歲的孩子解釋什麼是細胞?有一天我們將創造一個細胞內部的世界。

人體細胞?

或任何細胞。然後學生可以走進那個細胞,了解細胞核、酶、膜等等。所以妳可以將其用於許多可能性。

好的。那是妳的下一個前沿。我想,我也意識到妳所在的行業非常龐大且複雜。但有一些迫切的問題。我想知道我能否向妳提出其中幾個精選問題,請妳給我們一個本能的或者是簡短的回應,關於妳如何看待它們。例如,這妳以前聽過很多次了,第一,AI 會摧毀大量工作嗎?

技術確實會改變勞動力的格局。像 AI 這樣具有影響力和深遠意義的技術將對工作產生深遠的影響。

這已經在發生了。

這已經在發生了。

Salesforce 表示他們 50% 的客戶支持職位將因為 AI 而消失。

沒錯,還有軟體工程、聯絡中心、分析師工作。所以毫無疑問。

它不會在原處創造同樣多的工作機會,是嗎?我想知道這是否讓妳擔心。

我認為定論尚早。每當人類創造出一種更先進的技術,例如蒸汽機、電力、個人電腦、汽車,我們都經歷過困難時期,但也經歷了工作版圖的重新規劃。所以只談論數字變大或變小並不公平。我們需要以更細緻的方式看待這個問題,真正思考如何應對這種變化。有個體層面的責任。妳必須學習,妳必須提升自己的技能。但也有公司層面的責任。也有社會層面的責任。所以這是一個很大的問題。

第二個是一個更大的問題。如果您戴上耳機,我想播放一段關於人類是否會被 AI 取代的聲音和觀點。這是一個妳會知道的聲音,Geoffrey Hinton 教授,他的工作與妳的有重疊,他也是諾貝爾獎得主。

「當 AI 變得超級智能時,它可能只是取代我們。我們如何防止它接管?即使我們所有國家都合作,妳能做什麼?我認為目前所有大公司和政府都有錯誤的模型。他們的基本模型是,我是 CEO,這個超級智能 AI 是極其聰明的執行助理,我是老闆。當它比我們更聰明、比我們更強大時,情況就不會是那樣了。」

妳對此有何看法?因為 Hinton 教授認為,AI 導致人類滅絕的可能性有 10% 到 20%。

首先,Hinton 教授,或者我叫他 Geoff,因為我認識他 25 年了,從我是一年級研究生開始,他就是我欽佩並研讀其技術論文的人。但是關於取代人類種族這件事,我實際上恭敬地表示不同意。不是說它永遠不會發生。而是說如果人類種族真的陷入麻煩,在我看來,那是人類做錯事的結果,而不是機器做錯事的結果。

但他在那段錄音中提出的非常實際的一點是,當它變得比我們更聰明時,我們如何防止這個超級智能的創造物接管?我們對此沒有模型。現在,如果那個比我們更聰明的創造物說,「關閉人類的生命維持系統」,或者做其他生死攸關的事情,我們該如何阻止它?

所以我認為這個問題做了一個假設,即從今天(我們還沒有這樣的機器,超級智能機器)到那個東西被創造出來的那一天,人類沒有做任何事情來防止那一天的到來,只是假設那一天會到來。我甚至不一定認為它會到來。這是一種可能性,但這是一個公平的問題。或者至少在科學上,推測這一點很有趣,但讓我們假設這個推測是正確的。它將會到來。我們從今天到那天還有一段距離。我的問題是,為什麼人類整體會允許這種情況發生?我們的集體責任在哪裡?我們的治理在哪裡?

或者監管?

是的。

這就是為什麼我想知道,那麼妳認為有沒有辦法確保超級智能有一個上限?

我認為有辦法確保技術的負責任開發和使用。

國際間達成一致,在政府層面,是條約嗎?還沒有。僅僅是公司同意以某種方式行事嗎?

妳是對的。這個領域是如此新生,我們還沒有達到國際條約的水平,我們還沒有達到全球共識的水平。我認為我們有全球意識。我也想說,我們不應該過度關注 AI 唯一可能的後果或負面後果。這項技術很強大。它可能有其他負面後果。它對人類也有大量仁慈的應用。我們需要全面地看待這個問題。

是的。那麼妳會對某些問題感到沮喪嗎?因為我知道妳經常與政治家、擁有政治權力的人交談,妳在美國、英國、法國和其他地方都這樣做過。他們問妳的最常見的讓妳感到沮喪的問題是什麼?

我不會用沮喪這個詞。我會用「擔憂」這個詞,因為我認為我們關於 AI 的公共討論需要從「當機器霸主來臨時我們該怎麼辦」這個非常簡單的問題轉移開來。所以,我不感到沮喪,如果問這個問題的唯一方式是這個非常簡單的二元對立——妳想要它還是不想要它,我會感到擔憂。

我經常被問到的另一個問題,可能比這個問題更多,是全世界的父母問我:「AI 來了,我該如何建議我的孩子?我孩子的未來是什麼?他們應該做什麼?他們應該學習計算機科學嗎?他們會有工作嗎?」

那就回答它吧,因為聽這個節目的人可能也在想同樣的問題。妳說什麼?

我說。AI 是一個非常強大的技術,我也是一位母親。我們應該賦予孩子最重要的東西是賦予他們作為人類的能動性 (agency)、尊嚴和學習的渴望。還有一些永恆的人類價值觀。做一個誠實的人,做一個勤奮的人,有創造力,有批判性思維。

所以不要擔心他們學什麼?

擔心不是正確的詞。要完全知情並理解妳孩子的未來將生活在 AI 技術的世界中。根據他們的興趣、熱情、個性和環境,在那個未來中讓他們做好準備。擔心解決不了問題。

我有另一個行業問題,是關於流向像妳這樣的少數幾家公司的巨額資金。這是否可能是一個泡沫,這是否可能像網路泡沫一樣,結果證明其中一些公司被高估了。

首先,我的公司還是一家初創公司。當我們談論巨額資金時,我們真正看的是大型科技公司。AI 仍然是一項新興技術。從發展的角度來看,還有很多東西有待開發。科學非常難。要取得科學和技術突破需要付出很多。這就是為什麼為這些努力提供資源仍然很重要。這的另一面是市場。我們會看到市場的回報嗎?總體而言,我確實相信,AI 的應用如此巨大,無論我們談論的是軟體工程、創造力、醫療保健、教育還是金融服務,我認為我們將繼續看到 AI 市場的擴張。我認為,無論是在福祉還是生產力方面,都有很多需求。AI 作為助手、合作者可以提供幫助。在那一部分,我堅信這是一個不斷擴大的市場。

但在電力和能源以及氣候方面,代價是什麼?有一位妳可能認識的著名 AI 企業家 Jerry Kaplan,他說我們可能正走向一場新的生態災難,因為我們需要的數據中心數量不斷增加,消耗的能量也隨之增加。

這是一個有趣的問題。我確實認為,為了訓練大型模型,我們看到對電力或能源的需求越來越大。但從來沒有人說這些數據中心必須由化石燃料供電。所以我們在能源方面的創新將是這個創新週期的一部分。

我認為只是因為它們需要的能量如此巨大,很難看到僅靠再生能源就能滿足。

我認為目前這是事實。但我也知道,例如我訪問中東。那裡有很多為大數據中心建設再生能源的努力。我確實認為那些需要建設這些大數據中心的國家,也需要審視其能源政策和產業。這是我們投資和發展更多再生能源的機會。

妳對妳的行業有什麼擔憂?因為妳描繪了一幅非常積極的圖景,而且妳一直處於最前沿,妳看到了更多的潛力。所以我理解妳的立場,但在妳安靜的時刻呢?

我不是一個技術烏托邦主義者,也不是一個技術反烏托邦主義者。我認為我實際上是無聊的中間派。無聊的中間派希望用更務實和科學的視角來看待這個問題。所以什麼讓我擔憂?當然,任何工具落入錯誤心態或錯誤意圖的人手中都會讓我擔憂。就像我們說的,自人類文明破曉以來,火對我們物種來說是如此關鍵的發明。然而用火來傷害人,是非常糟糕的。所以任何對 AI 的錯誤使用都讓我擔憂。與公眾溝通的錯誤方式讓我擔憂,因為我確實感覺到世界各地有很多焦慮。

我的一個擔憂是我們的老師,特別是我們的 K-12 老師,這些人,我個人的經歷告訴我,他們是我們社會的脊梁。他們對於教育我們的後代至關重要。我們是否與他們進行了正確的溝通?我們是否帶領他們一起前進?我們的老師是否在使用 AI 工具來增強他們的職業能力?他們是否在傳遞或幫助我們的孩子使用 AI?

這是 Bloomberg 週末訪談。我們總是對人們的生活和工作感興趣。我意識到妳的生活,妳今天過的生活與妳成長過程中在父母的乾洗店工作、維持店鋪運營的方式截然不同。

我在家還是洗很多衣服。

作為這個時代這個行業的領導者,妳是否意識到妳在未來擁有的權力?

這是一個有趣的問題,Mishal。我意識到我的責任。我明白我是將這項技術帶給我們世界的人之一。我明白我很榮幸能夠在世界上最好的大學之一工作,教育明天的領導者並進行前沿研究。我意識到自己是一位企業家,也是生成式 AI 世界中最令人興奮的初創公司之一的 CEO。所以我所做的一切都有後果。這是我肩負的責任。我非常認真地對待這一點,因為這就是我一直告訴人們的,在 AI 時代,能動性應該在人類身上。能動性不在機器身上,而在我們身上。我的能動性是創造令人興奮的技術並負責任地使用它。

妳生活中的人類,妳的孩子,妳不讓他們用 AI 或他們的設備或在網路上做什麼?

不僅是我自己的孩子,任何人。我是一名教師,一名教育者。這是永恆的建議:不要用妳的工具做愚蠢的事情。妳必須思考為什麼妳在使用這個工具以及妳是如何使用它的。簡單來說,不要因為有 AI 就變懶,對吧?如果你想理解數學,也許大型語言模型可以給妳答案,但這不是學習提出正確問題的方式。妳可以使用 AI 工具來提示一個好問題,這樣妳就能從中學習。所以不要懶惰是其中之一。另一面是不要用它來做壞事。例如,訊息的完整性。假圖像、假聲音、假文本。這些是 AI 的問題,也是我們社會中社交媒體驅動的通訊問題。

我想妳是在這個充滿新發展和我們三年前甚至無法想像的挑戰的世界中,呼籲回歸老式的價值觀。

是的,妳可以稱之為老式,妳也可以稱之為永恆。作為一名教育者,作為一名母親,我認為有些人類價值觀是永恆的,我們需要認識到這一點。

好的,最後,關於妳的閱讀,因為從那個很小就閱讀經典著作的孩子到現在,當妳在週末放鬆時(如果真的發生過的話),妳讀什麼?

說實話,這些天我讀了很多技術論文。這有點可悲,我確實閱讀,我也讀書給我的孩子聽,我不得不說,這些天我最喜歡的書是《哈利波特》。因為它是一本很棒的書。我把它作為睡前讀物讀給我的孩子聽。

好吧,那個系列會讓妳持續很長一段時間,取決於妳讀到哪一本。

是的,我快讀完了。

所以妳沒有拿走他們生活中的兒童讀物?

不,因為他們生活在一個完全不同的時代,他們實際上是以一種與我那個時代完全不同的方式接觸訊息,在 90 年代或 80 年代的中國幾乎沒有電視。現在他們擁有整個網際網路。所以,我給了他們一個 Kindle。

是的。還有中文。妳跟他們說中文嗎?

我跟他們說中文,說得不是很好,但我確實跟他們說中文。他們的父親跟他們說義大利語。

好的。就像妳一樣,成為世界公民。

是的。

Fei-Fei Li 博士,非常感謝妳。

謝謝妳,Mishal。

💡 對我們的 AI 研究助手感興趣嗎?

使用 AI 技術革新您的研究流程、提升分析效率並發掘更深層次的洞見。

了解更多