認(rèn)知與技術(shù)領(lǐng)航,OPPO何以讓AI更進(jìn)一步
AI手機(jī)到底應(yīng)該是什么樣?面對(duì)這個(gè)問題,或許有不少朋友會(huì)下意識(shí)地看向iPhone,“蘋果是怎么做的”也儼然成為了手機(jī)圈一個(gè)風(fēng)尚。只可惜蘋果在AI領(lǐng)域起了個(gè)大早、趕了個(gè)晚集,就給了Android陣營(yíng)先人一步的機(jī)會(huì)。在剛剛舉行的ODC24上,OPPO方面向外界展示了成為AI手機(jī)旗手的底氣。
用AI來為手機(jī)賦能并不新鮮,自2011年的蘋果Siri就已開始初見端倪,再到2017年、2018年,隨著自然語言理解(NLP)技術(shù)的“白菜化”以及神經(jīng)網(wǎng)絡(luò)處理器(NPU)出現(xiàn),國(guó)內(nèi)廠商也扎堆做起了智能語音助手,并成為當(dāng)時(shí)手機(jī)廠商在新品發(fā)布會(huì)上的必講環(huán)節(jié)。
只可惜僅用了短短兩年時(shí)間,應(yīng)用場(chǎng)景有限、效率不高等問題的陸續(xù)出現(xiàn),使得用戶主動(dòng)冷落了智能語音助手。直到2023年,隨著生成式人工智能的出現(xiàn),手機(jī)AI又有了新的故事可講,此次OPPO就在ODC24上用系統(tǒng)級(jí)AI重構(gòu)了AI與操作系統(tǒng)的關(guān)系。
OPPO軟件工程事業(yè)部總裁唐凱在此次活動(dòng)中就提及,AIOS有三個(gè)階段,分別是應(yīng)用AI化、系統(tǒng)AI化,以及AI即系統(tǒng)。過去,AI在手機(jī)操作系統(tǒng)里只能錦上添花、局限于單點(diǎn)功能,比如曾經(jīng)的智能語音助手,就只擅長(zhǎng)處理諸如定鬧鐘、打電話、打開App等簡(jiǎn)單操作,面對(duì)復(fù)雜指令時(shí)就會(huì)陷入“雞同鴨講”的死循環(huán)。
顯而易見,曾經(jīng)作為手機(jī)里AI元素集中體現(xiàn)的智能語音助手,當(dāng)時(shí)就只能起到一個(gè)嘗鮮的作用。而在此次ODC24上亮相的“超級(jí)小布助手”則是嵌入操作系統(tǒng)底層、深度整合的系統(tǒng)級(jí)體驗(yàn),AI功能不僅僅體現(xiàn)在“超級(jí)小布助手”上,而是滲透到了系統(tǒng)的各個(gè)層級(jí)。
例如,OPPO推出的“一鍵問屏”功能,就是多模態(tài)交互能力的結(jié)晶,不僅要“看”、還要“聽”,然后根據(jù)用戶的語音和視覺反饋來做出反應(yīng)。這背后需要OPPO的AI平臺(tái)調(diào)用視覺模型、音頻模型,以及大語言模型協(xié)同工作,從而實(shí)現(xiàn)圖像和音頻識(shí)別與自然語言輸出。
不僅如此,OPPO借助SenseNow框架讓一鍵問屏實(shí)現(xiàn)了“邊看邊說”的功能,并且這可一點(diǎn)都不簡(jiǎn)單。要知道多模態(tài)大語言模型有一個(gè)重要的課題,即怎么對(duì)齊不同文本、圖像、音頻等不同模態(tài)。由于不同模態(tài)獲取的特征差異巨大,且模態(tài)復(fù)雜導(dǎo)致出現(xiàn)過擬合現(xiàn)象,最終會(huì)讓多模態(tài)模型的效果不如單模態(tài)結(jié)果。
OPPO此次推出的SenseNow智慧框架,就憑借強(qiáng)大的多模態(tài)直覺交互能力,能做到在對(duì)文本、圖像、音頻解碼生成的同時(shí),進(jìn)行跨模態(tài)的特征同步。用OPPO方面的說法,用戶在瀏覽內(nèi)容時(shí)可以立即詢問,AI也能實(shí)時(shí)響應(yīng),而不再需要在不同模態(tài)之間來回切換操作。
將各個(gè)模態(tài)的信息和交互整合到一起,OPPO顯然有著更多的意圖。用OPPO AI中心產(chǎn)品總監(jiān)張峻的話來說,“我們的目標(biāo)是讓AI助理像真人助理一樣,能夠'邊看、邊說、邊做'”。從最初的單線程進(jìn)化到多線程,OPPO不是為了做AI、而打造系統(tǒng)級(jí)AI,而是讓AI提升用戶的體驗(yàn),塑造一個(gè)交互和智能隨心,專屬陪伴、安全可信的個(gè)人化助理。
不過想要讓AI助手更像真人助理,單純整合不同模態(tài)的大模型是不夠的,AI智能體才是關(guān)鍵。一鍵問屏功能盡管優(yōu)秀,但也不是十萬個(gè)為什么,真正能讓用戶感知到AI確實(shí)有用,還得能自主執(zhí)行任務(wù)的AI智能體。在ODC24上,OPPOF就已經(jīng)展示了用“超級(jí)小布助手”訂機(jī)票的DEMO,但他們也坦言,要實(shí)現(xiàn)完全自動(dòng)化的操作確實(shí)有門檻。
以訂機(jī)票為例,據(jù)張峻透露,技術(shù)上我們已經(jīng)具備了一些能力,例如意圖識(shí)別和應(yīng)用喚醒,現(xiàn)在小布就支持說“給某某在*里發(fā)個(gè)紅包”,但要進(jìn)一步實(shí)現(xiàn)“完全自動(dòng)預(yù)訂”還需要解決用戶偏好問題,比如選哪家航空公司、什么時(shí)間的航班,這些就涉及到用戶的信任和個(gè)性化理解。
OPPO方面希望AI能夠逐步增強(qiáng)對(duì)用戶偏好的理解、加強(qiáng)AI智能體的記憶能力,從而讓每一個(gè)“超級(jí)小布助手”都對(duì)它們的主人了如指掌。盡管AI智能體的記憶力固然重要,但更重要的是行動(dòng)力。對(duì)此OPPO方面也展望了AI手機(jī)的未來,無論是傳感器的布局、還是芯片平臺(tái)都會(huì)進(jìn)行相應(yīng)升級(jí),以支持系統(tǒng)級(jí)的AI功能。
縱觀此次ODC24,OPPO要表達(dá)的并不是重做一個(gè)“小布”,而是希望以智能手機(jī)作為計(jì)算平臺(tái)、用AI來賦能用戶的科技生活。