蘋果想造的AI手機,卻被豆包搶先一步落地。
近日,豆包手機助手技術預覽版正式亮相,是基于豆包大模型、與手機廠商在操作系統(tǒng)層面深度合作的AI助手,能夠像人類一樣,真正理解并操作手機完成任務。
在演示視頻里,用戶只需開口下令,手機便能自動調用不同APP,完成比價、訂餐、規(guī)劃行程等一連串復雜操作,與當初IPhone16提到的AI手機概念有異曲同工之妙,甚至更強大。
目前,由中興通訊和字節(jié)跳動共同開發(fā),搭載該功能的努比亞M153工程樣機已同步開售,官方售價為3499元,但已有不少用戶在二手平臺加價出售。
有意思的是,盡管外界稱其為“豆包手機”,字節(jié)卻明確表示,目前并無自研手機計劃,而是正與多家手機廠商洽談助手合作。
從猛攻大模型,到試水自研AI硬件,再到以“生態(tài)合作”模式嵌入終端,字節(jié)的探索路徑,也是全球科技巨頭在AI時代爭奪“超級入口”的縮影。
至于這個下一代入口,究竟會誕生自哪來,由誰來定義和掌控,答案仍在激烈博弈中。
“繞過APP”的AI助手
去年9月,蘋果率先詮釋了什么叫“AI手機”,包括一鍵調用AI能力、讓Siri制訂旅游計劃、訂機票等。
不過,目前國行iPhone還未能用上這些功能,像自動整理通話錄音、智能行程規(guī)劃等部分功能也尚未完全上線,就連蘋果高層也在今年初表示,首版AI Siri表現(xiàn)不如預期 。
蘋果還在努力,豆包卻已落子成局,畢竟在AI時代,時間就是最寶貴的時機。
近日,豆包團隊發(fā)布了豆包手機助手技術預覽版,它繞過了APP,直接嵌入到手機操作系統(tǒng)底層,調動手機系統(tǒng)資源和所有APP,做到“模擬人一樣操作手機”。
如果說蘋果AI更側重“輔助交互”,核心是讓手機變聰明,減少用戶使用各項功能時的摩擦;那么豆包手機助手則是從“聽懂”到“看懂”,能夠直接模擬用戶點擊操作,相當于重新定義了人機交互方式。
在豆包發(fā)布的演示視頻里,用戶只要輸入“幫我在各個電商平臺比價下單某款商品”,豆包就會自動檢索各大電商平臺并篩選出最低價,只在敏感的支付環(huán)節(jié)等待用戶確認。
另外,在很多場景中,用戶只要給豆包一句語音指令,它就能很好執(zhí)行各種任務,包括提交出差申請、預訂機票、定時打卡簽到等。
豆包甚至還有記憶功能,在即將推出的Pro模式中,如果用戶打開了記憶,就不用在每一次執(zhí)行任務時反復交代細節(jié),整個操作過程會更絲滑。
而且,Pro模式的推理能力還會進一步增強,在演示視頻中,用戶要到巴黎旅游,要求豆包標記出其在社交平臺上收藏的餐廳,同時整理他喜歡的展覽會信息并預定機票,豆包也能打開多個APP進行一系列的復雜操作,整體耗時8分鐘左右。
當然,豆包手機助手所展現(xiàn)的能力,在概念層面并不算新鮮,自ChatGPT嶄露頭角以來,這類“AI Agent”的跨應用任務執(zhí)行能力就開始被廣泛討論。
只是,目前大多數(shù)手機廠商仍停留在“展示階段”,在真正能量產(chǎn)落地的手機中,豆包手機助手的表現(xiàn)是最全面的。而豆包之所以能夠先拔頭籌,關鍵在于兩大突破:
首先是系統(tǒng)級的深度嵌入,豆包手機助手能夠獲得安卓系統(tǒng)的底層權限,打通應用之間的壁壘,進行跨應用的連貫操作,大大提高了整個操作體驗的“絲滑感”。
相較之下,目前市面上不少智能體都在嘗試執(zhí)行預訂機票、執(zhí)行報銷等“擬人操作”,但由于這個過程涉及多個獨立應用的無縫跳轉與數(shù)據(jù)傳遞,很多時候只有定制的企業(yè)級智能體,才能真正打通航空公司、公司報銷流程等數(shù)據(jù),完成商業(yè)閉環(huán)。
其次則是豆包大模型在多模態(tài)能力上的積累。基于字節(jié)的短視頻基因,豆包對視覺、語音和場景有著深度的理解能力,使其能將多模態(tài)感知能力無縫遷移至手機交互,讓豆包助手能夠像人類一樣“看懂”手機畫面并進行操作。
雖然豆包沒有直接“造手機”,但它卻以軟件定義硬件的方式,改造了現(xiàn)有的入口系統(tǒng)。只是,當豆包守住入口,其他應用就只能淪為軟件服務商,“超級入口”爭奪戰(zhàn)一觸即發(fā)。
軟硬兼施,曲線布局
事實上,字節(jié)一直有個“硬件夢”。早期,其通過Pico布局AR/XR領域;從去年開始,其陸續(xù)布局AI耳機、AI玩具等領域,甚至不止一次傳出要自研AI手機。
只是,無論是Pico團隊的裁撤,還是上市一年在天貓、京東兩個電商平臺累計銷量僅為1-2萬臺的AI耳機“Ola Friend”,都可以看出AI硬件賽道不好闖。
可即便如此,AI硬件賽道卻持續(xù)火熱,因為大模型這個“靈魂”,終究需要一個“肉身”。
唯有將AI功能嵌入到手機、耳機、汽車等真實載體中,AI才能滲透到日常生活的不同場景中,接觸到更真實的數(shù)據(jù)、更直接的用戶需求,并與硬件能力進行深度整合。
這也是為什么越來越多互聯(lián)網(wǎng)大廠、汽車廠商,都在為自己貼上“AI科技公司”標簽,因為未來的超級入口將不僅僅是一個應用、一臺手機,而是跨設備、跨場景、持續(xù)演進的AI智能體,誰能更貼近用戶,支配更多的終端,擁有更多有權限調用入口,誰就能掌握生態(tài)主動權。
目前來看,在尋找合適的硬件載體這條路上,各巨頭所選擇的路徑并不一致。
阿里、字節(jié)、小米等大廠都率先選擇了自研模式。阿里推出了夸克AI眼鏡;谷歌的兩個AI眼鏡項目已進入小批量試產(chǎn)階段;甚至理想汽車也在近日宣布要推出AI眼鏡Livis。
自研模式的優(yōu)勢在于能夠完全掌握數(shù)據(jù)采集、系統(tǒng)調用和用戶交互的全流程,實現(xiàn)軟硬件協(xié)同的快速迭代,大廠也能在定義下一代交互入口的過程中,擁有更多的主動權。
不過,字節(jié)還嘗試了更靈活的模式,通過與手機廠商合作,重構手機操作系統(tǒng)的主控邏輯,以AI為紐帶賦能整個終端生態(tài),相當于用另一種形式掌握生態(tài)入口的話語權。
在這之前,谷Gemini與三星手機也采取了類似中興與豆包的合作模式,本質是“各取所需”。
站在手機廠商的角度,盡管近年不少廠商都在推進自研大模型,但實際落地的AI功能主要集中在生圖、摘要等消費者能夠直接感知的體驗上,跟頭部大模型在落地速度和深度上仍有明顯的代際差異。
跟豆包此類強勢的AI助手合作,既能為手機產(chǎn)品帶來更多的用戶流量,也能快速補齊大模型能力這一短板。
站在大模型企業(yè)的角度,AI硬件特別是手機行業(yè)的競爭早已是一片紅海,但其作為AI的重要載體,卻是繞不開的入口,與二三線手機廠商以及代工廠合作,則能“借船出?!?。
雖然大家的目的不同,但目標卻是一致的,當AI已經(jīng)將“手”伸向了物理世界,大家要做的則是盡快握住“這雙手”,從單純的模型能力軍備競賽,轉向軟硬件融合的智能終端“滲透戰(zhàn)”。
誰能成為最后贏家?
不過,豆包手機助手想要全面鋪開推廣,也并不容易。
首先,豆包手機助手的實用性與預期仍有差距。《晚點latepost》對努比亞M153工程樣機進行了實測,要求其打開各個外賣平臺,選出最低價外賣并下單。
跟真人操作相比,手機操作還略顯“笨拙”,整個過程耗時近2分鐘,比手動操作慢了1分鐘左右,也存在誤讀信息的可能。豆包團隊也提到,模型能力仍需要優(yōu)化。
其次,豆包的競爭對手,也不會坐以待斃。目前,華為、小米、OPPO、vivo等主流手機廠商都有自己的自研大模型,或許它們目前的模型能力不如豆包,但市場競爭壓力也會推動它們通過收購、合作等模式來提升模型能力。
一個明顯的趨勢是,這些廠商正在集體擁抱另一個選擇,接入像DeepSeek這樣的高性能開源模型,將大腦外包出去,但系統(tǒng)的“命門”則必須掌握自己手里。
還有各大電商和社交應用,也不會甘心淪為“服務商”,畢竟用戶數(shù)據(jù)、流量入口、內(nèi)容生態(tài)是整個商業(yè)模式的根本,一旦這些內(nèi)容都變成了冷冰冰的“數(shù)據(jù)”,那么被顛覆的將不僅是大廠自身的商業(yè)護城河,更是整個以平臺為中心的互聯(lián)網(wǎng)秩序。
最后,豆包還要過手機操作系統(tǒng)廠商這一關。近年,谷歌、蘋果等傳統(tǒng)操作系統(tǒng)巨頭也早已啟動了面向AI的升級,雖然蘋果的AI化進程不如預期,但它們也絕不會坐視自身被AI助手“架空”,寄生在它們之上的豆包,又何嘗不是被捏住了咽喉。
因此,豆包助手目前演示的流暢操作,更多是建立在理想化的合作前提下,現(xiàn)實中的商業(yè)博弈,會讓這條路布滿荊棘。
而且,當豆包試圖以軟件重新定義硬件時,其也無法擺脫硬件本身的制約。專業(yè)手機廠商在芯片調校、多攝協(xié)同、端側推理優(yōu)化等方面的積累,不是單純靠一個系統(tǒng)級助手就能跨越的。
目前,豆包和努比亞都強調這款AI手機主要面向開發(fā)者和科技極客,首銷備貨量約為50萬臺,距離主流旗艦機動輒200萬~300萬臺的出貨量仍有明顯差距。
如果豆包想跟更多手機廠商合作,那么其就不能只是做一臺“樣板機”,能否找到屬于字節(jié)的“賽力斯”,將會成為接下來拓展生態(tài)合作模式的關鍵。
不過,大部分手機廠商也仍在觀望,有手機廠商內(nèi)部人士透露,需要觀察豆包的下一個技術方案,目前這款產(chǎn)品更像是測試版,而不是一款真正意義上的消費電子產(chǎn)品。
但對字節(jié)而言,首款AI手機能夠收獲多少訂單并非關鍵,重要的是將以往分散的大模型、應用、硬件等AI布局深度整合起來,形成一種連貫、可用、可閉環(huán)的智能服務體系。
未來,這一智能服務體系不僅能部署在手機上,還能覆蓋眼鏡、耳機、智能家電甚至是智能車機等更多終端設備,目前,已有奔馳、賽力斯等車企的智能車機搭載了豆包大模型。
不少硬件創(chuàng)業(yè)者都對豆包手機表達了贊譽。錘子科技創(chuàng)始人羅永浩就表示,“字節(jié)嘗試走出這第一步,是非常了不起的,必須點個贊?!?/span>
字節(jié)懷揣“硬件夢”多年,卻一直未能圓夢,如今,借著豆包殺了一個回馬槍。雖然字節(jié)也未必能贏下整盤棋,但它已經(jīng)創(chuàng)造了一種新的可能,也為“入口爭奪戰(zhàn)”加入了新的博弈因素。
在AI定義體驗的時代,不會做硬件的軟件公司,和沒有AI靈魂的硬件公司,都有可能出局。因此,要成為新的“超級入口”,科技大廠還需要找到更多新的籌碼。