來(lái)源:貝殼財(cái)經(jīng)
記者 羅亦丹
編輯 王進(jìn)雨
實(shí)習(xí)生 郭栩君

12月以來(lái),五大派豆包手機(jī)助手成為科技圈最為關(guān)注的豆包熱點(diǎn)話題。1日驚艷發(fā)布、手機(jī)p使2日手機(jī)“一機(jī)難求”、遭圍主流3日微信異常退出后引發(fā)權(quán)限爭(zhēng)議、剿實(shí)4日5日陸續(xù)遭第三方產(chǎn)品限制登錄……各路人馬圍繞這款A(yù)I手機(jī)助手的測(cè)款功能、安全性以及其蘊(yùn)含的不動(dòng)可能改變現(xiàn)有互聯(lián)網(wǎng)商業(yè)模式的力量爭(zhēng)論不休。
繼12月1日開始至今,五大派已經(jīng)過(guò)去了10天。豆包當(dāng)最猛烈的手機(jī)p使風(fēng)波過(guò)后,這款搭載了豆包手機(jī)助手的遭圍主流豆包中興合作工程樣機(jī)nubia M153(以下簡(jiǎn)稱“豆包手機(jī)”)還能否保有其最初宣發(fā)時(shí)的功能?在科技邏輯、安全邏輯與商業(yè)邏輯一周的剿實(shí)摩擦碰撞下,豆包手機(jī)目前守住了哪些陣地?測(cè)款其核心的AI手機(jī)助手功能有沒(méi)有受到影響?對(duì)此,新京報(bào)貝殼財(cái)經(jīng)記者在這款手機(jī)上,不動(dòng)圍繞點(diǎn)外賣、五大派訂機(jī)票、導(dǎo)航等日常場(chǎng)景進(jìn)行實(shí)測(cè),并邀請(qǐng)專家進(jìn)行了分析。
01
23款A(yù)pp中8款使用受限
15款仍可通過(guò)AI操作
在推出初期,豆包手機(jī)曾展現(xiàn)跨平臺(tái)比價(jià)、發(fā)送微信等功能,但以12月3日有用戶反映微信賬號(hào)異常退出,豆包手機(jī)隨即下線其自動(dòng)操作微信能力這一事件為開端,豆包手機(jī)一頭撞上了App的“風(fēng)控墻”,后續(xù)接連限制了多個(gè)場(chǎng)景的AI能力。甚至有用戶擔(dān)憂,豆包手機(jī)將變成不能用的“板磚”。
對(duì)此,新京報(bào)貝殼財(cái)經(jīng)記者在12月8日以“這是一部新手機(jī),需要安裝一些日常所需要的App,幫我推薦并下載”為提示詞,一共下載了23款A(yù)pp,涉及社交通訊、生活服務(wù)、購(gòu)物消費(fèi)、辦公學(xué)習(xí)、娛樂(lè)休閑五大類。
記者使用豆包手機(jī)實(shí)測(cè)發(fā)現(xiàn),在這23款A(yù)pp中,淘寶、美團(tuán)、支付寶、拼多多、貓眼5款A(yù)pp直接無(wú)法登錄;微信、高德地圖、大麥網(wǎng)3款A(yù)pp可以手動(dòng)登錄但無(wú)法通過(guò)AI操作;而滴滴、QQ、京東等15款A(yù)pp的使用則完全不受影響,既可以登錄,也可以通過(guò)AI操作。具體情況見(jiàn)下表:

23款主流App在“豆包手機(jī)”上的運(yùn)行情況.新京報(bào)貝殼財(cái)經(jīng)記者羅亦丹根據(jù)12月8日實(shí)測(cè)情況制圖
貝殼財(cái)經(jīng)記者梳理發(fā)現(xiàn),上述被限制功能的8款A(yù)pp分別隸屬于騰訊、阿里巴巴、美團(tuán)、拼多多以及光線傳媒五家大廠旗下。此外,根據(jù)豆包手機(jī)助手官方在12月5日發(fā)布的信息,出于金融安全和游戲公平的考慮,其對(duì)銀行等金融類應(yīng)用以及游戲場(chǎng)景的應(yīng)用也進(jìn)行了限制。
豆包手機(jī)助手無(wú)法打開微信。
從上述結(jié)果來(lái)看,目前豆包這一“光明頂”已然遭遇了“五大派”圍攻,但也可以發(fā)現(xiàn),大廠對(duì)豆包手機(jī)的限制也并非“一刀切”,比如騰訊旗下的QQ,阿里旗下的夸克依然可以正常被豆包手機(jī)助手調(diào)取。
那么,“還能用”的豆包手機(jī),現(xiàn)在可以帶給用戶怎樣的新體驗(yàn)?zāi)兀?/p>
02
全新AI助手體驗(yàn):
一句話記住用戶喜好
跳過(guò)彈窗和廣告,可后臺(tái)運(yùn)行
新京報(bào)貝殼財(cái)經(jīng)記者通過(guò)2天的實(shí)測(cè)發(fā)現(xiàn),目前豆包手機(jī)所搭載的AI助手能力確實(shí)到了“可以落地”的階段,并且一些功能極具實(shí)用性。
讓記者印象最深的就是,當(dāng)使用豆包手機(jī)助手打開App執(zhí)行任務(wù)時(shí),其可以精準(zhǔn)識(shí)別并點(diǎn)擊關(guān)閉廣告、找到用戶指定的功能入口。
要知道,當(dāng)前不同App的各式彈窗“防不勝防”,一些彈窗的關(guān)閉手段極其隱蔽,極易誤導(dǎo)用戶。但當(dāng)豆包手機(jī)助手打開這些App時(shí),它會(huì)針對(duì)不同的彈窗形式采取“點(diǎn)擊關(guān)閉”或“等待彈窗消失”等處理措施。且成功率極高,很少點(diǎn)擊進(jìn)入廣告。

豆包手機(jī)助手執(zhí)行任務(wù)中正在關(guān)閉彈窗。豆包手機(jī)截圖
另外,在面對(duì)一些App的引誘式選項(xiàng)時(shí),它也能清楚分辨,例如記者經(jīng)常使用某OTA平臺(tái)購(gòu)買飛機(jī)票,此類平臺(tái)在購(gòu)買機(jī)票步驟的末尾通常會(huì)通過(guò)選項(xiàng)顏色加深等方式“引導(dǎo)”用戶購(gòu)買保險(xiǎn)等附加服務(wù),而當(dāng)記者本次測(cè)試時(shí),豆包手機(jī)助手就在這一步進(jìn)行了提示,“清楚明了”地咨詢記者“是否要添加附加服務(wù)”。

豆包手機(jī)助手在購(gòu)買機(jī)票場(chǎng)景時(shí)咨詢記者“是否需要添加附加服務(wù)”。豆包手機(jī)截圖
而面對(duì)任務(wù)執(zhí)行中遇到的突發(fā)事件,豆包手機(jī)助手也展示了相當(dāng)程度的靈活性,其可以通過(guò)嘗試不同路徑解決問(wèn)題。當(dāng)記者喚醒豆包手機(jī)助手,要求其導(dǎo)航時(shí),它首先打開了高德地圖,但遭遇打開限制,便再次打開了百度地圖。而要求豆包手機(jī)助手P圖時(shí),其首先嘗試了手機(jī)自帶的美顏功能,之后又上小紅書尋找了P圖方法,在上述兩個(gè)方法均失敗后,又登錄了瀏覽器,通過(guò)咨詢“哪些App可以P圖”,最后下載了美圖秀秀,直至任務(wù)完成,它共嘗試了4條路徑。
這種靈活性在記者要求其上嗶哩嗶哩對(duì)某UP主的視頻進(jìn)行評(píng)論時(shí)達(dá)到了令人驚嘆的地步:豆包手機(jī)助手按照記者要求登錄嗶哩嗶哩,但在視頻評(píng)論時(shí)發(fā)現(xiàn)記者的賬號(hào)等級(jí)不夠,無(wú)法評(píng)論,要評(píng)論就必須得邀請(qǐng)好友或答題。此時(shí),記者通過(guò)手機(jī)助手的“補(bǔ)充”功能添加了指令“幫我答題”。結(jié)果,豆包手機(jī)助手真的開始一題題幫助記者進(jìn)行了答題(每答一題的思考時(shí)間不同),并在8分鐘后回答了60道嗶哩嗶哩“考題”,最終通過(guò)了嗶哩嗶哩的測(cè)試,升級(jí)到LV2后發(fā)表了任務(wù)最開始所要求的評(píng)論。

豆包手機(jī)助手在完成嗶哩嗶哩評(píng)論的任務(wù)時(shí)“順便”幫助記者的賬號(hào)通過(guò)了答題測(cè)試。 豆包手機(jī)截圖
豆包手機(jī)助手正在進(jìn)行B站答題(視頻為8倍速)。
最后,面對(duì)用戶的模糊要求,豆包手機(jī)助手也有一定的“主見(jiàn)”,甚至還能通過(guò)記憶力幫助用戶進(jìn)行選擇。
例如,記者此前曾通過(guò)豆包手機(jī)助手在便簽中輸入了“我想吃豬腳飯”。而之后,記者通過(guò)豆包手機(jī)助手下達(dá)指令“幫我訂一份晚飯,點(diǎn)什么你看著辦,便宜點(diǎn),離我近的都行”這樣的模糊指令之后,豆包手機(jī)助手的執(zhí)行邏輯顯示為“搜索豬腳飯,篩選便宜近的”。而在京東外賣的頁(yè)面,當(dāng)遭遇起送價(jià)不夠,需要湊單的情況時(shí),面對(duì)記者下達(dá)的“你看著湊”的指令,選擇了鹵蛋和鹵丸子作為推薦的湊單商品,而類似的選項(xiàng)還有鹵豆干、紫菜蛋花湯、烤腸、荷包蛋等,這一“選擇”正屬于豆包手機(jī)助手的“主觀”推薦。

豆包手機(jī)助手自動(dòng)幫助用戶在外賣場(chǎng)景進(jìn)行“湊單”。豆包手機(jī)截圖
不過(guò),貝殼財(cái)經(jīng)記者在測(cè)試中發(fā)現(xiàn),豆包手機(jī)助手也存在一定的局限性,在一些復(fù)雜任務(wù)中也會(huì)發(fā)生錯(cuò)誤。如其在執(zhí)行“購(gòu)買12月9日天津到北京的高鐵票”這一任務(wù)時(shí),其執(zhí)行邏輯是首先遍閱當(dāng)日所有車票,但由于當(dāng)日兩地高鐵票數(shù)量過(guò)多,該任務(wù)在執(zhí)行數(shù)分鐘后自動(dòng)停止了。此外,在執(zhí)行一個(gè)“打開QQ音樂(lè),播放某歌手傳唱度最高的歌曲”這一任務(wù)時(shí),豆包手機(jī)助手播放了該歌手歌單列表中第一首歌曲,但該歌曲的瀏覽量和點(diǎn)贊量并非最高。
同時(shí),豆包手機(jī)助手在12月5日更新后,無(wú)法完成一些激勵(lì)場(chǎng)景,如記者要求其“幫忙打開網(wǎng)易云音樂(lè)并看廣告領(lǐng)取免費(fèi)聽VIP歌曲時(shí)長(zhǎng)”時(shí),豆包手機(jī)助手回應(yīng)“涉及用戶賬戶和激勵(lì)體系的操作,無(wú)法直接為您執(zhí)行”。
“豆包手機(jī)助手的工程化水平很高,完成度很好,是未來(lái)智能終端的雛形。不過(guò),對(duì)于需要實(shí)時(shí)響應(yīng)的場(chǎng)景,如攝像頭采集的高清視頻理解等,豆包手機(jī)助手的響應(yīng)速度還不夠?!泵姹谥悄苁紫茖W(xué)家劉知遠(yuǎn)在接受貝殼財(cái)經(jīng)記者采訪時(shí)表示。
03
豆包手機(jī)助手絲滑運(yùn)行的背后:
高系統(tǒng)權(quán)限與閱讀屏幕能力
貝殼財(cái)經(jīng)記者注意到,之所以豆包手機(jī)能夠帶給人“絲滑”的AI手機(jī)助手體驗(yàn),和該手機(jī)在系統(tǒng)層面就給豆包手機(jī)助手讓渡了INJECT_EVENTS權(quán)限,以及豆包本身的大模型能力都有關(guān)系。
記者在實(shí)測(cè)中發(fā)現(xiàn),當(dāng)喚醒豆包手機(jī)助手執(zhí)行一個(gè)任務(wù)時(shí),其會(huì)在接受任務(wù)后默認(rèn)最小化到手機(jī)屏幕正上方,在后臺(tái)執(zhí)行該任務(wù),這就給了用戶無(wú)感的任務(wù)執(zhí)行體驗(yàn),而這正是通過(guò)INJECT_EVENTS權(quán)限才能達(dá)到的效果。
事實(shí)上,AI手機(jī)助手并非豆包首創(chuàng),華為、小米、榮耀等都有過(guò)AI手機(jī)助手的嘗試,并使用INJECT_EVENTS權(quán)限,實(shí)現(xiàn)一些特定場(chǎng)景的操作手機(jī)任務(wù),例如通過(guò)語(yǔ)音指令定鬧鐘、打開某個(gè)App等。第三方App則只能通過(guò)無(wú)障礙權(quán)限實(shí)現(xiàn)“讀取屏幕+模擬點(diǎn)擊”,如智譜的AutoGLM手機(jī)智能體演示過(guò)的發(fā)紅包操作,這種方式會(huì)占用手機(jī)終端的屏幕,用戶無(wú)法同時(shí)在手機(jī)上操作其他事項(xiàng)。
對(duì)此,網(wǎng)絡(luò)安全專家曲子龍向記者解釋,無(wú)障礙權(quán)限的工作邏輯,完全是模仿用戶的前臺(tái)應(yīng)用操作。手機(jī)智能體若是依附這項(xiàng)應(yīng)用層的權(quán)限,中止無(wú)障礙權(quán)限就等同于退出一款應(yīng)用,自然不會(huì)繼續(xù)執(zhí)行任務(wù)。而豆包助手是一個(gè)擁有手機(jī)系統(tǒng)底層權(quán)限的應(yīng)用,所以具備后臺(tái)執(zhí)行任務(wù)的能力。但I(xiàn)NJECT_EVENTS權(quán)限只負(fù)責(zé)模擬用戶指令的操作,“允許后臺(tái)活動(dòng)”需要系統(tǒng)提供其他的權(quán)限才能完成。
技術(shù)上,AI手機(jī)助手的核心邏輯實(shí)際上是“閱讀理解手機(jī)屏幕”的能力。根據(jù)量子位消息,豆包手機(jī)助手的圖形界面操作能力,建立在字節(jié)自研的UI-TARS模型基礎(chǔ)之上,這是一款今年1月字節(jié)Seed團(tuán)隊(duì)與清華聯(lián)手開源的模型。而“豆包手機(jī)”使用的是UI-TARS閉源版本,不僅性能優(yōu)于其開源版本,還針對(duì)Mobile Use進(jìn)行了大量?jī)?yōu)化,這為豆包手機(jī)提供了關(guān)鍵的技術(shù)支撐。
兩套“組合拳”下來(lái),才形成了豆包手機(jī)當(dāng)前所展現(xiàn)出的功能。
不過(guò),上文中所提到的INJECT_EVENTS權(quán)限因其本身屬于“系統(tǒng)簽名權(quán)限”,在12月3日一度成為豆包手機(jī)助手遭遇質(zhì)疑的理由。當(dāng)日晚間,豆包手機(jī)助手官方立即進(jìn)行了辟謠,表示只有用戶主動(dòng)授權(quán)才可以調(diào)用該權(quán)限,“豆包手機(jī)助手不存在任何黑客行為?!?/p>
12月9日,一名曾經(jīng)編寫過(guò)國(guó)內(nèi)信息安全相關(guān)法規(guī)的專家在復(fù)盤此事件時(shí)告訴貝殼財(cái)經(jīng)記者,豆包手機(jī)相當(dāng)于擁有了一把“萬(wàn)能鑰匙”,因此才能帶來(lái)流暢的用戶體驗(yàn),但可能會(huì)觸及多個(gè)App的風(fēng)控機(jī)制,“不同App的風(fēng)控機(jī)制不一樣,有些安全系數(shù)比較高的,可能會(huì)認(rèn)為一些異常行為不是用戶操作,而是機(jī)器代理操作,判斷為黑灰產(chǎn)的‘貓池’,最終限制登錄”。
對(duì)于AI手機(jī)助手可能在執(zhí)行用戶任務(wù)中獲取用戶信息的問(wèn)題,有聲音認(rèn)為將AI助手的能力限制在本地,采用端側(cè)模型或許是較好的解決之道。
劉知遠(yuǎn)多年從事端側(cè)大模型研發(fā),對(duì)此,他告訴貝殼財(cái)經(jīng)記者,“豆包手機(jī)助手里面應(yīng)該也有一個(gè)本地的語(yǔ)音模型,算是比較簡(jiǎn)單的端云協(xié)同。未來(lái)一定是端云協(xié)同共同完成端側(cè)智能的任務(wù),主要是端云如何分工的問(wèn)題,我覺(jué)得大致應(yīng)該是 personalized to professional,即端側(cè)負(fù)責(zé)個(gè)性化,云側(cè)負(fù)責(zé)專業(yè)化(如數(shù)學(xué)、代碼等)?!?/p>
04
技術(shù)能否突破隱私的高墻
和商業(yè)的圍城
當(dāng)前,擋在豆包手機(jī)以及所有AI手機(jī)助手面前的有兩大難關(guān):除了對(duì)隱私安全的擔(dān)憂,還有打破現(xiàn)有商業(yè)模式所面臨的阻力。
事實(shí)上,除去隱私安全這一顧慮,令其他App更加難以接受的或許是AI手機(jī)出現(xiàn)本身將徹底打破移動(dòng)互聯(lián)網(wǎng)時(shí)代,一個(gè)個(gè)App“割地為王”搶占用戶流量的現(xiàn)有生態(tài)。
舉個(gè)例子,貝殼財(cái)經(jīng)記者在實(shí)測(cè)中可以通過(guò)語(yǔ)音方式喚起豆包手機(jī)助手,讓它進(jìn)行“放歌”操作。如果是用戶來(lái)操作,首先需要打開音樂(lè)App,看完或跳過(guò)開屏廣告,再取消幾個(gè)“辦會(huì)員”等廣告彈窗后,最后搜索并點(diǎn)擊所想要聽的歌曲。
但通過(guò)豆包手機(jī)助手,上述行為可以完全在后臺(tái)進(jìn)行,用戶本身對(duì)此完全無(wú)感。那么對(duì)于音樂(lè)App來(lái)說(shuō),所有的彈窗廣告行為都將無(wú)效,該App的商業(yè)價(jià)值也將打折扣,最終可能徹底淪為AI手機(jī)助手的一個(gè)“通道”。
在這一邏輯下,許多App對(duì)豆包手機(jī)助手進(jìn)行“抵制”不難理解。曲子龍告訴貝殼財(cái)經(jīng)記者,對(duì)于如何發(fā)現(xiàn)用戶所使用的是豆包手機(jī),“手機(jī)App獲取設(shè)備型號(hào)、品牌、制造商、硬件信息、系統(tǒng)版本這個(gè)是完全開放的,通過(guò)運(yùn)行環(huán)境阻斷是最簡(jiǎn)單辦法,當(dāng)然也可以用權(quán)限檢測(cè),當(dāng)檢測(cè)到在使用INJECT_EVENTS權(quán)限,進(jìn)行模擬輸入時(shí)直接拒絕。”這也是上述App能夠?qū)Χ拱謾C(jī)“設(shè)限”的技術(shù)原因。
“AI手機(jī)助手方便歸方便,但撬動(dòng)不了背后的利益。如果要解決這一問(wèn)題,最后的邏輯是必須形成一個(gè)緊密的聯(lián)盟,在這個(gè)聯(lián)盟里,大家的利益完全可以協(xié)調(diào),沒(méi)有任何利益沖突,但這過(guò)于理想了,這本身就是一個(gè)重塑生態(tài)的過(guò)程?!鄙鲜鰧<腋嬖V貝殼財(cái)經(jīng)記者。
“被第三方App封殺是一定會(huì)發(fā)生的,所以需要從一些特定場(chǎng)景開始切入可能更有機(jī)會(huì),如工作場(chǎng)景?!眲⒅h(yuǎn)說(shuō)。
中國(guó)社會(huì)科學(xué)院大學(xué)互聯(lián)網(wǎng)法治研究中心主任劉曉春表示,在獲得用戶明確授權(quán)、確保個(gè)人信息處理等行為合規(guī)的前提下,AI代替用戶訪問(wèn)第三方應(yīng)用,是用戶意志的合法體現(xiàn)。AI智能代理行業(yè)尚處于初期,技術(shù)與規(guī)范尚在探索。對(duì)這類創(chuàng)新技術(shù),需以包容審慎態(tài)度,在精準(zhǔn)規(guī)范風(fēng)險(xiǎn)的同時(shí)為創(chuàng)新留出空間,助力行業(yè)良性發(fā)展。
“AI帶來(lái)的變革是真實(shí)存在的,用戶需求也是真實(shí)存在的,豆包和中興的探索是一個(gè)開始。”12月9日,抖音副總裁李亮發(fā)布了這樣一條微博。
海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP 責(zé)任編輯:楊賜