原文來(lái)源:硅基立場(chǎng)
作者|駱軼航
圖片來(lái)源:由無(wú)界 AI?生成
這是我體驗(yàn)過(guò)的第一個(gè)由智能手機(jī)廠商自主研發(fā)的大語(yǔ)言模型——vivo推出的基于藍(lán)心大模型的“藍(lán)心小V”。作為“大模型神農(nóng)”,我最近測(cè)試任何一個(gè)模型服務(wù)之前都會(huì)提醒自己“降低預(yù)期”,特別是對(duì)那些視頻拍得過(guò)于酷炫的demo。但對(duì)藍(lán)心大模型,我的感覺(jué)是:合乎預(yù)期。它不算酷炫,但還算實(shí)用。
作為智能手機(jī)廠商推出的大語(yǔ)言模型,人們通常認(rèn)為它不會(huì)太大,參數(shù)較低,涌現(xiàn)效果可能不會(huì)太出色,理解一些復(fù)雜文本和意圖會(huì)出bug。但我從藍(lán)心大模型中得到的體驗(yàn)是相反的:它展現(xiàn)了創(chuàng)作和總結(jié)方面強(qiáng)大的推理能力,可以達(dá)到80分以上,反倒是在基礎(chǔ)的搜圖和常規(guī)寫(xiě)作等方面的表現(xiàn)中乘。
要知道,目前vivo X100系列手機(jī)上搭載的藍(lán)心大模型是專(zhuān)門(mén)面向手機(jī)打造的端側(cè)場(chǎng)景和云端兩用模型,遠(yuǎn)沒(méi)有千億級(jí)參數(shù)的大模型那么“大”。但當(dāng)我丟給它一篇關(guān)于大模型的涌現(xiàn)現(xiàn)象是否真實(shí)存在的文章時(shí),它十分精準(zhǔn)地找到了里面最關(guān)鍵最核心的那個(gè)論點(diǎn):大模型涌現(xiàn)能力產(chǎn)生是研究者選擇的度量標(biāo)準(zhǔn)而并非模型能力擴(kuò)展的結(jié)果,所以并不是真正的“智能涌現(xiàn)”。
這確實(shí)有點(diǎn)讓我震撼。因?yàn)椤白x文檔”對(duì)大語(yǔ)言模型來(lái)說(shuō),是一個(gè)有些難度系數(shù)的工作,不是哪個(gè)模型都讀得好的。比如ChatGPT近期閱讀復(fù)雜冗長(zhǎng)PDF文件的能力就發(fā)生了驚人的退化,尤其是在概括力上。但藍(lán)心大模型的藍(lán)心小V能一下子找到最關(guān)鍵的論點(diǎn)。值得一提的是,在測(cè)試的時(shí)候,我特別勾選的是“本地總結(jié)”的功能,完全在用這臺(tái)vivo X100機(jī)器自身的算力(聯(lián)發(fā)科天璣9300)和推理能力進(jìn)行總結(jié),它某種程度上打破了“大模型必須得大”的固有認(rèn)知。
接著,我發(fā)現(xiàn)了一個(gè)更有意思的現(xiàn)象:當(dāng)你把一篇更長(zhǎng)的論文上傳給藍(lán)心大模型之后,它依然能提煉出最關(guān)鍵和最重要的觀點(diǎn)和發(fā)現(xiàn),但延展敘述往往草率幾句話(huà)了事,“好讀書(shū)而不求甚解”。它與一些其它的大模型Chat Bot在閱讀理解能力上形成了反差:很多模型拆解信息能力強(qiáng),提煉概括能力不夠。藍(lán)心大模型是概括提煉得無(wú)比精準(zhǔn),但不愿意拆解細(xì)讀,不愿意浪費(fèi)token在解釋問(wèn)題上,這應(yīng)該是跟模型大小密切相關(guān)的。
在手機(jī)本地的照片搜索、影像查找方面,藍(lán)心大模型的響應(yīng)速度堪稱(chēng)絲般順滑,比如在一秒之內(nèi)找到手機(jī)本地存儲(chǔ)的所有“關(guān)于故宮的照片”。在旅游攻略書(shū)寫(xiě)等方面,它的表現(xiàn)中規(guī)中矩。在圖像創(chuàng)作上,它畫(huà)的故宮、牛肉拉面、麻辣香鍋都能接近ChatGPT的DALL-E的水準(zhǔn),但在想象力上不如ChatGPT豐富,畫(huà)不出特別瘋狂開(kāi)腦洞的圖來(lái)。不過(guò),在我讓它畫(huà)“一個(gè)AI深沉地思考人類(lèi)的未來(lái)”的時(shí)候,它竟然給了我一張有著如此這般意境的圖片。
此外,藍(lán)心大模型通過(guò)自然對(duì)話(huà)操控APP的能力是顯著的。我跟它說(shuō)我想點(diǎn)麻辣香鍋的外賣(mài),它會(huì)告訴你這臺(tái)新手機(jī)上沒(méi)有安裝美團(tuán),當(dāng)你同意它安裝之后,它會(huì)到應(yīng)用商店自動(dòng)下載美團(tuán)APP。然后,幫你打開(kāi)到都是“麻辣香鍋”的頁(yè)面。當(dāng)然你可以認(rèn)為,蘋(píng)果Siri也做的到,因?yàn)樽鳛橄到y(tǒng)底層助手級(jí)應(yīng)用,調(diào)取這部手機(jī)上的權(quán)限是輕而易舉的。但區(qū)別是,Siri只能接受非常清晰的指令來(lái)打開(kāi)哪個(gè)app,面對(duì)一個(gè)籠統(tǒng)的自然語(yǔ)言需求是無(wú)能為力的,它是一個(gè)嵌入式的智能語(yǔ)音模塊,但藍(lán)心小V在藍(lán)心大模型的加持下,已經(jīng)算是一個(gè)有自然語(yǔ)言理解能力的Copilot了。
總之,幾個(gè)關(guān)鍵功能調(diào)教下來(lái),你會(huì)有一個(gè)比較確信的方向和判斷,那就是端側(cè)大模型這件事是成立的,是靠譜的。而且,端側(cè)大模型甚至整個(gè)大語(yǔ)言模型落地到千家萬(wàn)戶(hù)和蕓蕓眾生,可能還是得靠手機(jī)廠商,無(wú)論你愿意不愿意。
某種程度上,適配手機(jī)的大模型其實(shí)更接近微軟最近強(qiáng)調(diào)的“小語(yǔ)言模型”,它的參數(shù)通常不能超過(guò)100億,否則手機(jī)內(nèi)存跑不起來(lái),這也意味著它只能進(jìn)行特定方面的訓(xùn)練,或把一個(gè)模型訓(xùn)練到某種輸出程度,然后打住。對(duì)于絕大多數(shù)人來(lái)說(shuō),這就足夠用了。近期大火的巴黎創(chuàng)業(yè)公司Mistral AI,就是這么一家小模型公司。
以藍(lán)心大模型公布的參數(shù)看,1700億參數(shù)的云上大模型用于蒸餾訓(xùn)練低參數(shù)量級(jí)模型,得到70億參數(shù)的模型,把計(jì)算和推理同時(shí)放在云側(cè)和手機(jī)的端側(cè),而10億參數(shù)模型的計(jì)算和推理只在端側(cè)。這也是高通、聯(lián)發(fā)科、英特爾和AMD們?yōu)榱藬[脫英偉達(dá)詛咒不斷在嘗試和搗鼓的。模型不塞進(jìn)手機(jī)和PC里,他們就沒(méi)機(jī)會(huì)。但能塞進(jìn)手機(jī)和PC的模型,往往不夠大,是小模型。
小模型有小模型的好處:只專(zhuān)注把幾件事做好,不做冗長(zhǎng)的信息和代碼輸出,有幾個(gè)亮點(diǎn),其它方面則一般。比如Mistral AI,代碼寫(xiě)的就是比ChatGPT強(qiáng)。再比如藍(lán)心大模型,提煉和處理本地文檔就是比別的模型精準(zhǔn),管理起個(gè)人手機(jī)里的文檔和日程就是更高效。其它畫(huà)圖、寫(xiě)作和搜索也都會(huì),但并不算突出。但這又怎么樣呢?
在當(dāng)下中國(guó)討論生成式人工智能的未來(lái),有一個(gè)詭異的現(xiàn)象:高舉高打的人不落地,落地生活的人對(duì)AI又無(wú)感。大部分人是沒(méi)用過(guò)ChatGPT的,對(duì)文心一言、通義千問(wèn)和ChatGLM可能也就是聽(tīng)說(shuō)過(guò)和偶爾一用,看不到這些玩意兒對(duì)自己有什么本質(zhì)的變化。而死磕大模型參數(shù)、規(guī)模和基準(zhǔn)測(cè)評(píng)結(jié)果的這些玩家,所有成果都放在了Hugging Face和GitHub上,幾乎從來(lái)不面向普通人做推廣,對(duì)普通人也無(wú)感。AI開(kāi)發(fā)者和用戶(hù)雙向無(wú)感,這種局面可能短期內(nèi)是無(wú)法改變的。
但如果智能手機(jī)廠商做大語(yǔ)言模型,可能就不太一樣了。主要的原因是:用戶(hù)是有感的。當(dāng)大模型內(nèi)置在操作系統(tǒng)的底層,可以隨時(shí)喚起、輔助和調(diào)用功能,就像藍(lán)心大模型長(zhǎng)在Origin OS4上那樣,用戶(hù)就會(huì)不由自主地需要它,需要它的輔助,測(cè)試它的潛力,甚至需要它的陪伴。它可能不是一個(gè)萬(wàn)能的大模型,可能就是個(gè)小模型,但是它懂它的用戶(hù),熟悉設(shè)備里的數(shù)據(jù),了解用戶(hù)習(xí)慣,保護(hù)用戶(hù)的隱私,能幫著排日程、打開(kāi)外賣(mài)菜單、總結(jié)文檔、挑挑照片,完成一些基礎(chǔ)寫(xiě)作,它就是大多數(shù)人“夠用”和“可信任”的AI了。
推動(dòng)大語(yǔ)言模型的普及,肯定不是通過(guò)AI編程實(shí)現(xiàn)的,也不是只有刷新SOTA評(píng)估的技術(shù)突破才能造福大多數(shù)人類(lèi)。就像鞋子合適不合適,只有穿上了才知道一樣,一個(gè)模型合適不合適,只有用了才知道。我最近這段時(shí)間在有意識(shí)地“去ChatGPT化”:閱讀論文和文檔靠Kimi Chat,案頭工作靠文心一言和ChatGLM,個(gè)人助手就靠vivo藍(lán)心大模型,不為別的,因?yàn)樗昂仙怼薄D悴黄诖C合趕超ChatGPT,但我真的是需要一個(gè)手機(jī)上能用的,保護(hù)個(gè)人隱私和數(shù)據(jù)安全的,各項(xiàng)平均分?jǐn)?shù)還過(guò)得去的“大模型”或“小模型”。
大語(yǔ)言模型是用來(lái)給人用的,又不是拿來(lái)吹牛X的。