2025 機器人技術論壇:通用人形機器人 vs. 專用機器人,商業化之路的挑戰與契機

主持人:Junwu Zhang (主持人)

來賓:Evan Tao,TetherIA創辦人;Anand Lalwani,Cardinal Robots創辦人; Jan Liphardt,Openmind創辦人

摘要

Alignment 2025 機器人技術論壇的專家座談,深入探討專用任務型機器人與通用人形機器人之間的發展路線之爭。講者們討論了機器人普及化的關鍵瓶頸,包括硬體成本、軟體架構、可靠性、商業模式、資金,以及在現實世界中部署所面臨的保險與安全挑戰。

Highlight

1.

也許我們在長期來看,同時需要專用任務機器人和人形機器人?

這取決於你要進入哪個行業或領域。如果你鎖定的是有足夠資金的 B2B 企業客戶,那麼專用任務型機器人會好得多,因為單一任務就足以讓一台機器人忙上超過 24 小時。在這種情況下,我不需要一個過度設計的通用型機器人。

2.

Junwu Zhang:Evan,你剛剛完成了展示。在 Tesla 和 Elon 一起工作的感覺如何?因為你的背景是來自 Optimus 團隊。與他共事的感覺如何?那段經歷又是如何影響你創辦自己的公司?

Evan:當然,我想 Elon 絕對是一位傑出且獨一無二的企業家。他有著深厚的技術驅動思維,並且是第一性原理的忠實信徒。從第一天起,Optimus 就成為他近期的主要焦點。我們每週會與他開會,了解最新進展和他的指導方向。他總是告訴我們要努力實現完整的人形形態,即使這將是一條漫長且充滿挑戰的道路。他堅信一旦技術到位,我們最終會成功,而且市場將會是巨大的。我們有時甚至會在晚上 11 點和他開會,他會來到辦公室審視機器人,每個人都待在那裡。所以他是一個非常硬核的創辦人。

3.

思考型機器的最佳架構是什麼。正如我們已經聽到的,在機器人學中,做到極致的「具體」是至關重要的。當人們談論機器人或人形機器人時,明確指出你試圖完成的任務是至關重要的。

如果你觀察全球經濟,大約有三分之一是基於體力勞動,也就是人們親手做事。每年大約有 30 兆美元是基於人類在物理世界中做事。而在這三分之一中,又有大約三分之一與手有關。所以,顯然如果你想做像 iPhone 組裝這樣的工作,那麼精巧的手就至關重要。

4.

Junwu Zhang:去年 Elon 說 Optimus 機器人的成本只會在 2 萬到 3 萬美元左右。你覺得這可行嗎?如果可行的話,像你們這樣的新創公司,如何與像 Tesla 這樣擁有強大製造能力的公司競爭?

Evan:完全同意。首先,關於 Elon 提出的 2 萬到 3 萬美元的價格點,我完全相信。任何東西一旦進入大規模生產,我們基本上就是在優化所有流程,所以成本會降到物料清單成本和純粹的材料成本。談到汽車,汽車有那麼重的材料,但價格也就在 4 萬到 5 萬美元左右。所以我完全相信,人形機器人最終的價格會降到 2 萬到 3 萬美元。

然而,談到我們如何在這場與 Elon 或 Tesla 的競爭中立足,我相信正如剛剛所說,未來將會有許多不同外形的機器人。Elon 試圖打造的 Optimus 是一個單一規格(SKU),一種人形形態。但人類並不是為執行所有任務而設計的最高效形態。但我相信「手」將會與更多不同的任務有更高的兼容性。所以會有不同的平台,集成各種手形。作為一家專注於手的公司,我們也會開發不同規格的手。即使是人手,我們也生來不同。有些人有非常靈巧的手,可以彈奏樂器;有些人的手則更強壯,適合勞動。我們的機器人手也會是如此。

5.

Anand:我們與 30 多家機器人公司的 CEO 進行了交談,他們都已經完成了 A 輪融資,但卻無法進入 B 輪。這是一個普遍現象,許多知名的機器人公司,如 Local Motors、Savvy Robotics 等都面臨這個問題。他們失敗的最大原因之一是難以獲得資金。資金成本很高。通常有兩種融資方式:你可以去銀行貸款,像 Silicon Valley Bank,但利率會非常高,因為你是一家新創公司,還沒有盈利;或者你可以去找創投,他們會拿走你的一部分股權,但這是設有門檻的資金,如果你沒有達到某些基準,他們就不會給你更多錢。

機器人很貴,也不容易製造,需要大量的研發投入。而我的大多數客戶不想為一台機器人預付 5 萬美元。他們更願意每月支付 1000 美元,因為這跟他們習慣支付給人類來做同樣工作的成本差不多。

那麼,你如何彌合這個差距?如果你拿到一份 500 台機器人的訂單,每台機器人成本 2 萬美元,你就需要 1000 萬美元的資金來採購或製造這些機器人。誰會給你這 1000 萬美元?創投嗎?不會,這太耗費資金了,對他們來說投資回報率不存在。銀行呢?他們會吃掉你所有的利潤。

所以我們創建了這個基金,與 18 家不同的銀行組成一個財團,來承保這些合約,為最終客戶提供擔保,利率大約在 3% 到 4%,遠低於 Silicon Valley Bank 的 8%。

逐字稿

開場介紹

Junwu Zhang:好的,歡迎來到 Alignment 2025 的下午場次,希望各位午餐愉快。歡迎來到機器人座談會。我是主持人 Junwu Zhang,剛剛已經介紹了我們三位出色的嘉賓。

我想分享的第一個有趣故事是,Anand 去年也來過這裡。他來了之後,今年他的公司就有了一筆八億美元的基金,專門用於機器人新創公司的融資。我希望我們的活動能成為一個幸運符,希望我們所有的與談人參加完活動後,也能募集到更多資金。

我們剛剛看到了一個非常精彩的展示。如同講者介紹的,我們這個座談會中有不同的觀點。

專用機器人 vs. 人形機器人:從商業價值出發

Junwu Zhang:Anand,我們就從你開始吧。在這個座談中,你將扮演我們所謂的「X因素」。剛剛的展示非常精彩,但老實說,我已經不記得上一次機器人展示沒有摺衣服或摘水果是什麼時候了。在一個對人形機器人如此狂熱的環境中,你如何能保持如此鎮定與動力,繼續專注於清潔機器人?

Anand:這很酷,因為我能賺錢。我有大型企業投入大筆資金,讓我解決他們真正的問題。在我看來,你可以選擇兩種路線:一是透過解決客戶問題來獲得收入,二是透過追逐熱潮從創投那裡募集數百萬資金。

Junwu Zhang:這很酷。所以如果專為特定應用或任務設計的機器人能賺錢,這是否意味著人形機器人短期內無法賺錢?這是個很尖銳的觀點。

Junwu Zhang:我認為你們兩位都稍微看好人形機器人。也許我們在長期來看,同時需要專用任務機器人和人形機器人?

Anand:這取決於你要進入哪個行業或領域。如果你鎖定的是有足夠資金的 B2B 企業客戶,那麼專用任務型機器人會好得多,因為單一任務就足以讓一台機器人忙上超過 24 小時。在這種情況下,我不需要一個過度設計的通用型機器人。打個比方,如果有人問 Henry Ford 如何設計一個更好的交通系統,他不會去改造一匹馬或一個人,而是會打造一輛汽車。汽車在將貨物從 A 點運到 B 點方面效率遠高於其他方式。我的吸塵機器人在吸塵方面,會比任何試圖做同樣工作的人形機器人表現得更出色。單是這棟建築,如果我要徹底吸塵,可能需要四到五台不同的吸塵機器人才能完成。這比一台試圖完成或一個團隊試圖完成同樣工作的人形機器人要便宜得多、可靠得多,也更容易實現。所以一切都歸結於你的目標是什麼。在企業應用中,任務本身已經足夠重要和龐大,專用機器人能讓你更可靠地實現投資回報。

在 Tesla Optimus 團隊與 Elon Musk 共事的經驗

Junwu Zhang:Evan,你剛剛完成了展示。在 Tesla 和 Elon 一起工作的感覺如何?因為你的背景是來自 Optimus 團隊。與他共事的感覺如何?那段經歷又是如何影響你創辦自己的公司?

Evan:當然,我想 Elon 絕對是一位傑出且獨一無二的企業家。他有著深厚的技術驅動思維,並且是第一性原理的忠實信徒。從第一天起,Optimus 就成為他近期的主要焦點。我們每週會與他開會,了解最新進展和他的指導方向。他總是告訴我們要努力實現完整的人形形態,即使這將是一條漫長且充滿挑戰的道路。他堅信一旦技術到位,我們最終會成功,而且市場將會是巨大的。我們有時甚至會在晚上 11 點和他開會,他會來到辦公室審視機器人,每個人都待在那裡。所以他是一個非常硬核的創辦人。

Junwu Zhang:這太驚人了。這是否意味著你的公司也要工作到晚上 11 點?

Evan:我們正在打造人形機器人,但我們是人類。

大型語言模型 (LLM) 為何是人形機器人的轉捩點?

Junwu Zhang:Jan Liphardt,接下來請教你。說到熱潮,我讀到您的公司 OpenMind 實際上將 Asimov 的定律和機器人身份認證放在了區塊鏈上。如果這些詞彙組合在一起還不算是熱潮,那我不知道什麼纔是了。但我知道您是貨真價實的,因為您已經是 Stanford 的教授。我想知道,您現在在人形機器人領域看到了什麼,讓您如此興奮,甚至願意離開學術界創辦自己的公司?您已經在 Stanford 擁有了如此高的聲望和資源。

Jan Liphardt:嗯,你的問題包含了很多層面。但對我這樣一個熱愛機器人的人來說,最令人興奮的是,機器人學領域一個長期存在的問題——即如何清晰地實現所謂「通用能力」的人形機器人——現在已經有了明確的路徑。這是因為大多數大型語言模型(LLMs)都能「說」流利的機器人語言。過去那種為機器人建構軟體的舊觀點,無論是確定性的任務導向方法,還是端到端的 AI 方法,現在我們有了一套新的工具,讓我們可以快速地將機器人重新應用於醫院、家庭、工作場所等各種不同的任務。這就是最令人興奮的部分:許多大型語言模型已經能說流利的機器人語言了。

Junwu Zhang:你說的「說流利的機器人語言」是什麼意思?是指它們能與程式碼 API 有良好的連接,還是指人類可以用語言更好地指揮機器人?

Jan Liphardt:可以這樣想,大型語言模型非常擅長補完故事。如果我給一個大型語言模型一本書的第一章,我可以讓它寫完剩下的十一章。如果我將世界表示為一段連續的文本,我就可以讓大型語言模型繼續這個故事。如果我再將這個大型語言模型連接到一個實體外殼上,讓它能夠移動、探索、互動、吠叫、提問、表達情感,那麼我面前的這個物體突然之間就變得更具互動性、更吸引人,並且能以機器人學前所未有的方式進行學習。

機器人普及化的瓶頸:硬體、軟體與開源

Junwu Zhang:所以是互動性的層面。好的,Evan,回到你身上。你剛剛提到,我們會根據不同的硬體類型來設計不同的軟體,這也是公司通常的做法。但 Jan Liphardt,你相信開源和模組化的軟體。你認為不同類型的硬體,或許都能與你所擁有的同一個開源軟體協同工作。我想問,你為什麼認為機器人操作系統需要開源?這樣的軟體又如何幫助解決一些軟體上的瓶頸?

Jan Liphardt:好的,你的問題裡有很多值得探討的地方。首先是為什麼開源有用。網際網路就是運行在開源軟體上的,地球上大多數手機運行的也是開源軟體,也就是 Android。所以,開源軟體如何驅動重要事物,有很多例子可以證明。

另一點你提到的是,思考型機器的最佳架構是什麼。正如我們已經聽到的,在機器人學中,做到極致的「具體」是至關重要的。當人們談論機器人或人形機器人時,明確指出你試圖完成的任務是至關重要的。例如,如果你正在建造一個人形性愛機器人,顯然,你試圖達成的目標、商業案例和外形規格,與吸塵器或 BMW 想要用來將螺栓裝入引擎控制單元的東西,有著天壤之別。

如果你觀察全球經濟,大約有三分之一是基於體力勞動,也就是人們親手做事。每年大約有 30 兆美元是基於人類在物理世界中做事。而在這三分之一中,又有大約三分之一與手有關。所以,顯然如果你想做像 iPhone 組裝這樣的工作,那麼精巧的手就至關重要。

因此,回到你的問題,人形機器人的正確架構是什麼?沒有簡單的答案。這取決於你想做什麼。如果你要物理性地操作物體,這需要像我們今天早些時候看到的關於手的精湛技術,但它也需要驚人的計算能力。理解你的物理世界、決定你的手應該做什麼,然後能夠處理所有這些自由度來完成一項任務,這是一個巨大的計算問題。

關於目前許多公司正在做的事情,也就是探索人形機器人的模組化、樂高積木式的架構——包括 Intrinsic、OpenAI 的機器人技術、NVIDIA、Foxconn 的人形機器人,以及其他所有正在為人形機器人開發軟體的人——核心思想是,調試小塊的軟體要比微調像端到端 AI 這樣的大系統容易得多。所以,不僅僅是我們在考慮模組化架構,業界的許多其他人也在這麼做。

Junwu Zhang:Evan,我想很快地問你一個問題。因為你之前也現在都在研究機器人手。我們可能不知道它只花了 300 美元,卻集成了通常要價數千美元的手才有的功能和自由度。我想知道你們是如何做到的?最近有什麼技術突破嗎?以及,是什麼讓你們在執行這些複雜任務時仍然感到困難?

Evan:當然。我認為,談到機器人手,特別是人形外觀的手,重點不僅僅在於讓這個關節移動、實現多少自由度,更多的是要理解人手的最終功能性。為什麼是這樣的外形?人們是如何與周遭物體互動的?這就是為什麼我們堅持採用纜線肌腱驅動的架構。雖然有其他架構,比如連桿機構或直接驅動,它們看起來移動得很平滑、很漂亮,但它們並不是為了真正像人手一樣工作而設計的。所以這一點非常重要,這就是我們選擇纜線驅動架構的原因。這是我從機械設計角度的一些看法。

我們今天展示的手是一款完全開源的手,包括硬體和軟體。我們將依賴工業界、學術界,甚至是業餘愛好者來共同貢獻,圍繞這個硬體創建一個生態系統,讓它變得越來越好。這就是為什麼我們將它的市場定價為 214 美元,讓人們可以輕易地進入靈巧操作這個領域,而不需要花大錢。

商業模式的挑戰:成本、競爭與資金來源

Junwu Zhang:去年 Elon 說 Optimus 機器人的成本只會在 2 萬到 3 萬美元左右。你覺得這可行嗎?如果可行的話,像你們這樣的新創公司,如何與像 Tesla 這樣擁有強大製造能力的公司競爭?

Evan:完全同意。首先,關於 Elon 提出的 2 萬到 3 萬美元的價格點,我完全相信。任何東西一旦進入大規模生產,我們基本上就是在優化所有流程,所以成本會降到物料清單成本和純粹的材料成本。談到汽車,汽車有那麼重的材料,但價格也就在 4 萬到 5 萬美元左右。所以我完全相信,人形機器人最終的價格會降到 2 萬到 3 萬美元。

然而,談到我們如何在這場與 Elon 或 Tesla 的競爭中立足,我相信正如剛剛所說,未來將會有許多不同外形的機器人。Elon 試圖打造的 Optimus 是一個單一規格(SKU),一種人形形態。但人類並不是為執行所有任務而設計的最高效形態。但我相信「手」將會與更多不同的任務有更高的兼容性。所以會有不同的平台,集成各種手形。作為一家專注於手的公司,我們也會開發不同規格的手。即使是人手,我們也生來不同。有些人有非常靈巧的手,可以彈奏樂器;有些人的手則更強壯,適合勞動。我們的機器人手也會是如此。

Junwu Zhang:Anand,關於你的八億美元基金,我想問,你是如何發現這成為你的商業模式之一?你在哪裡找到了這個需求?為什麼機器人新創公司不能自己找到客戶和資金?

Anand:這是一個好問題。長話短說,我們與 30 多家機器人公司的 CEO 進行了交談,他們都已經完成了 A 輪融資,但卻無法進入 B 輪。這是一個普遍現象,許多知名的機器人公司,如 Local Motors、Savvy Robotics 等都面臨這個問題。他們失敗的最大原因之一是難以獲得資金。資金成本很高。通常有兩種融資方式:你可以去銀行貸款,像 Silicon Valley Bank,但利率會非常高,因為你是一家新創公司,還沒有盈利;或者你可以去找創投,他們會拿走你的一部分股權,但這是設有門檻的資金,如果你沒有達到某些基準,他們就不會給你更多錢。

機器人很貴,也不容易製造,需要大量的研發投入。而我的大多數客戶不想為一台機器人預付 5 萬美元。他們更願意每月支付 1000 美元,因為這跟他們習慣支付給人類來做同樣工作的成本差不多。

那麼,你如何彌合這個差距?如果你拿到一份 500 台機器人的訂單,每台機器人成本 2 萬美元,你就需要 1000 萬美元的資金來採購或製造這些機器人。誰會給你這 1000 萬美元?創投嗎?不會,這太耗費資金了,對他們來說投資回報率不存在。銀行呢?他們會吃掉你所有的利潤。

所以我們創建了這個基金,與 18 家不同的銀行組成一個財團,來承保這些合約,為最終客戶提供擔保,利率大約在 3% 到 4%,遠低於 Silicon Valley Bank 的 8%。

現實世界的考驗:可靠性、安全性與信任

Junwu Zhang:你認為機器人大規模採用的瓶頸是什麼?是硬體方面,還是軟體方面?或者,是其他因素?

Anand:在我們和我們的合作夥伴之間,我們大約部署了 35,000 台機器人在真實世界中。我們的客戶包括 Walmart、Amazon、Apple、NVIDIA、Meta、Marriott 和 GFM 等。

我們看到的最大挑戰,而且我們也正在克服的,不是製造機器人,也不是軟體,甚至不是硬體。而是機器人一直、一直、一直在故障。

我想問 Evan,你的機器手臂多久會故障一次?

Evan:嗯,我想一旦我們真正部署,這會是一個相當大的問題。

Anand:在我部署的 48 個州裡,我可以告訴你,此刻就有一個州有一台故障的機器人。這是我最大的頭痛問題——正常運行時間。我們必須確保我們的機器人能夠運作,為此我們正在僱用數千名退伍軍人,訓練他們成為我們的機器人技術員。這才是需要克服的真正挑戰。與此同時,還有整個財務方面的問題。你如何獲得資金來實現這一切?機器人並不便宜,硬體也不便宜。很多大家追求的任務,比如摺衣服,都是最低工資的工作。在美國大部分地區,時薪仍然是 10 到 12 美元。在這種情況下,你如何讓數學模型成立?

Junwu Zhang:我們距離可靠的機器人手還有多遠?此外,從可靠性延伸出來的一個問題是,如果機器人是可靠的,它就是安全的,我們就可以開始信任它。Rodney Brooks 教授本週早些時候在一篇文章中說,如果人形機器人的手有觸覺反饋,將能極大地促進更好的人機互動。所以,從更廣泛的角度來看,機器人手在這一切中扮演什麼角色?

Evan:我個人認為,也許在未來兩三年內,我們會在硬體方面,特別是手上,看到很多成熟的發展。但對於整個身體,特別是雙足行走,那還需要更長的時間,因為要達到那種成熟度,需要整個系統的改進。但僅就手本身而言,我相信隨著整個社會的資源集中起來,讓它變得越來越好,我們會在兩三年內實現目標。

Junwu Zhang:Jan Liphardt,你可能是唯一一個我知道的與機器人共同生活的人。我想知道,當你與這些實際生活在你家裡的機器人互動時,你如何確保安全與信任?

Jan Liphardt:我鼓勵在座所有的工程師、投資者、銀行家和科學家,都去買一台機器人,並試著和它一起生活。因為這會立刻暴露出一長串在實驗室中無關緊要,但對於將人形機器人或四足機器人部署到家庭中卻至關重要的問題。一個很好的例子就是散熱。現在很多的人形機器人都裝有巨大的風扇,24 小時不停地「嗡嗡」作响。如果你試過在一個人形機器人旁邊睡覺,那巨大的散熱風扇聲簡直是不可能的。

這在實驗室裡是無關緊要的,因為沒人關心噪音水平。但另一件事是,當人形機器人在你家裡走動時,在木地板上會發出很大的「哐、哐、哐」的聲音。這些都是只有當你試圖與人形機器人共存時才會變得明顯的小事情。

關於信任,打造人形機器人開源軟體的整個想法,對我個人而言,是一個無需思考的決定。我有孩子,我希望我的孩子們能夠窺探周圍這些思考型機器的「大腦」,然後說:「啊哈,我大概能看懂這裡發生了什麼。我能看到數據如何流動,我能看到 bug,我可以貢獻、添加修復。」

回過頭看,專注於人形機器人的開源軟體,不僅對我作為一個父親有意義,它也具有很好的商業意義,原因我們之前已經聽過了。想像你是一家所謂的「國際」人形機器人製造商,你想把產品賣到美國市場。祝你好運。想像一下,你想把你的機器人賣給美國的警察局、消防站、小學、醫院。第一個問題就會是:「我們為什麼要相信這個軟體?數據會不會被傳到我不想讓它去的地方?」對此,一個很好的解決方案是,如果你製造了好的硬體,為什麼不使用在舊金山用愛心打造的開源軟體,並讓數據留在美國符合 HIPAA 規定的伺服器上?所以,結果證明,為許多不同垂直領域打造開源軟體,不僅對這個房間裡所有關心技術走向的父母有益,而且在與中國機器人公司進行收入分成協議時,也具有非常實際的商業意義。

Junwu Zhang:Anand,你剛剛對 Jan Liphardt 說的關於保險和其他現實問題的部分笑得很開心,有什麼想補充的嗎?

Anand:是的,這就是現實世界與學術界或新創世界的區別。在現實世界中,保險是件大事,需要有保險憑證(COI),還必須遵守法律。祝你好運,想讓大型語言模型在任何一家大公司獲得批准。祝你好運,想把像 Unitree 這樣的中國機器人部署進去,因為你知道那裡有很多後門,隱私是個大問題,數據安全也是個大問題。你如何讓它們被大規模部署在企業環境中?你如何讓 J.P. Morgan 的辦公室被機器人清潔?我很偏執,因為那是一個巨大的安全風險。我們在許多不同的設施中,我們的機器人運行在 SpaceX 和軍事基地裡。所以,你如何通過安全審查?如何處理保險?如何處理可靠性?如何確保機器人故障時有人能到場修理?這就是現實世界,這些問題比其他任何事情都更需要被解決,而且人們正在花費更多時間試圖解決這些特定的問題。

Junwu Zhang:Jan Liphardt,我對你還有一個問題。五根手指和三根手指的需求差異在哪裡?什麼任務真正需要五根手指,而三根手指做不到?

Evan:這確實是個很好的問題。我想,當你談論基本的取放任務時,三根手指對於一個穩定的五點支撐來說已經足夠了。然而,一旦你開始談論工具操作,比如使用吸塵器,我會說你至少需要四根手指。你需要四根手指來先握住你的工具,然後用你的食指去按動開關。如果你沒有額外的冗餘,也就是你的無名指,只有三根手指,那你現在就只用兩根手指拿起吸塵器,然後用一根食指去按開關,那樣的狀態並不穩定。我會說,也許第五根手指,也就是小指,沒有那麼重要,但四根手指絕對是必要的。

💡 對我們的 AI 研究助手感興趣嗎?

使用 AI 技術革新您的研究流程、提升分析效率並發掘更深層次的洞見。

了解更多