當(dāng)前位置：區(qū)塊鏈 >區(qū)塊鏈 > vivo X100系列的藍(lán)心小V是我用過(guò)的最“合身”的大語(yǔ)言模型

vivo X100系列的藍(lán)心小V是我用過(guò)的最“合身”的大語(yǔ)言模型

更新時(shí)間：2023-12-28 17:41:00 | 作者：佚名

原文來(lái)源：硅基立場(chǎng) 作者｜駱軼航圖片來(lái)源：由無(wú)界AI?生成這是我體驗(yàn)過(guò)的第一個(gè)由智能手機(jī)廠商自主研發(fā)的大語(yǔ)言模型——vivo推出的基于藍(lán)心大模型的“藍(lán)心小V”。作為“大模型神農(nóng)”，我最近測(cè)試任何一個(gè)模型服務(wù)之前都會(huì)提醒自己“降低預(yù)期”，特別是對(duì)那些視頻拍得過(guò)于酷炫的demo。但對(duì)藍(lán)心大模型，我的感覺(jué)是：合乎預(yù)期。它不算酷炫，但還算實(shí)用。作為智能手機(jī)廠...

原文來(lái)源：硅基立場(chǎng)

作者｜駱軼航

圖片來(lái)源：由無(wú)界 AI?生成

這是我體驗(yàn)過(guò)的第一個(gè)由智能手機(jī)廠商自主研發(fā)的大語(yǔ)言模型——vivo推出的基于藍(lán)心大模型的“藍(lán)心小V”。作為“大模型神農(nóng)”，我最近測(cè)試任何一個(gè)模型服務(wù)之前都會(huì)提醒自己“降低預(yù)期”，特別是對(duì)那些視頻拍得過(guò)于酷炫的demo。但對(duì)藍(lán)心大模型，我的感覺(jué)是：合乎預(yù)期。它不算酷炫，但還算實(shí)用。

作為智能手機(jī)廠商推出的大語(yǔ)言模型，人們通常認(rèn)為它不會(huì)太大，參數(shù)較低，涌現(xiàn)效果可能不會(huì)太出色，理解一些復(fù)雜文本和意圖會(huì)出bug。但我從藍(lán)心大模型中得到的體驗(yàn)是相反的：它展現(xiàn)了創(chuàng)作和總結(jié)方面強(qiáng)大的推理能力，可以達(dá)到80分以上，反倒是在基礎(chǔ)的搜圖和常規(guī)寫(xiě)作等方面的表現(xiàn)中乘。

要知道，目前vivo X100系列手機(jī)上搭載的藍(lán)心大模型是專(zhuān)門(mén)面向手機(jī)打造的端側(cè)場(chǎng)景和云端兩用模型，遠(yuǎn)沒(méi)有千億級(jí)參數(shù)的大模型那么“大”。但當(dāng)我丟給它一篇關(guān)于大模型的涌現(xiàn)現(xiàn)象是否真實(shí)存在的文章時(shí)，它十分精準(zhǔn)地找到了里面最關(guān)鍵最核心的那個(gè)論點(diǎn)：大模型涌現(xiàn)能力產(chǎn)生是研究者選擇的度量標(biāo)準(zhǔn)而并非模型能力擴(kuò)展的結(jié)果，所以并不是真正的“智能涌現(xiàn)”。

這確實(shí)有點(diǎn)讓我震撼。因?yàn)椤白x文檔”對(duì)大語(yǔ)言模型來(lái)說(shuō)，是一個(gè)有些難度系數(shù)的工作，不是哪個(gè)模型都讀得好的。比如ChatGPT近期閱讀復(fù)雜冗長(zhǎng)PDF文件的能力就發(fā)生了驚人的退化，尤其是在概括力上。但藍(lán)心大模型的藍(lán)心小V能一下子找到最關(guān)鍵的論點(diǎn)。值得一提的是，在測(cè)試的時(shí)候，我特別勾選的是“本地總結(jié)”的功能，完全在用這臺(tái)vivo X100機(jī)器自身的算力（聯(lián)發(fā)科天璣9300）和推理能力進(jìn)行總結(jié)，它某種程度上打破了“大模型必須得大”的固有認(rèn)知。

接著，我發(fā)現(xiàn)了一個(gè)更有意思的現(xiàn)象：當(dāng)你把一篇更長(zhǎng)的論文上傳給藍(lán)心大模型之后，它依然能提煉出最關(guān)鍵和最重要的觀點(diǎn)和發(fā)現(xiàn)，但延展敘述往往草率幾句話(huà)了事，“好讀書(shū)而不求甚解”。它與一些其它的大模型Chat Bot在閱讀理解能力上形成了反差：很多模型拆解信息能力強(qiáng)，提煉概括能力不夠。藍(lán)心大模型是概括提煉得無(wú)比精準(zhǔn)，但不愿意拆解細(xì)讀，不愿意浪費(fèi)token在解釋問(wèn)題上，這應(yīng)該是跟模型大小密切相關(guān)的。

在手機(jī)本地的照片搜索、影像查找方面，藍(lán)心大模型的響應(yīng)速度堪稱(chēng)絲般順滑，比如在一秒之內(nèi)找到手機(jī)本地存儲(chǔ)的所有“關(guān)于故宮的照片”。在旅游攻略書(shū)寫(xiě)等方面，它的表現(xiàn)中規(guī)中矩。在圖像創(chuàng)作上，它畫(huà)的故宮、牛肉拉面、麻辣香鍋都能接近ChatGPT的DALL-E的水準(zhǔn)，但在想象力上不如ChatGPT豐富，畫(huà)不出特別瘋狂開(kāi)腦洞的圖來(lái)。不過(guò)，在我讓它畫(huà)“一個(gè)AI深沉地思考人類(lèi)的未來(lái)”的時(shí)候，它竟然給了我一張有著如此這般意境的圖片。

此外，藍(lán)心大模型通過(guò)自然對(duì)話(huà)操控APP的能力是顯著的。我跟它說(shuō)我想點(diǎn)麻辣香鍋的外賣(mài)，它會(huì)告訴你這臺(tái)新手機(jī)上沒(méi)有安裝美團(tuán)，當(dāng)你同意它安裝之后，它會(huì)到應(yīng)用商店自動(dòng)下載美團(tuán)APP。然后，幫你打開(kāi)到都是“麻辣香鍋”的頁(yè)面。當(dāng)然你可以認(rèn)為，蘋(píng)果Siri也做的到，因?yàn)樽鳛橄到y(tǒng)底層助手級(jí)應(yīng)用，調(diào)取這部手機(jī)上的權(quán)限是輕而易舉的。但區(qū)別是，Siri只能接受非常清晰的指令來(lái)打開(kāi)哪個(gè)app，面對(duì)一個(gè)籠統(tǒng)的自然語(yǔ)言需求是無(wú)能為力的，它是一個(gè)嵌入式的智能語(yǔ)音模塊，但藍(lán)心小V在藍(lán)心大模型的加持下，已經(jīng)算是一個(gè)有自然語(yǔ)言理解能力的Copilot了。

總之，幾個(gè)關(guān)鍵功能調(diào)教下來(lái)，你會(huì)有一個(gè)比較確信的方向和判斷，那就是端側(cè)大模型這件事是成立的，是靠譜的。而且，端側(cè)大模型甚至整個(gè)大語(yǔ)言模型落地到千家萬(wàn)戶(hù)和蕓蕓眾生，可能還是得靠手機(jī)廠商，無(wú)論你愿意不愿意。

某種程度上，適配手機(jī)的大模型其實(shí)更接近微軟最近強(qiáng)調(diào)的“小語(yǔ)言模型”，它的參數(shù)通常不能超過(guò)100億，否則手機(jī)內(nèi)存跑不起來(lái)，這也意味著它只能進(jìn)行特定方面的訓(xùn)練，或把一個(gè)模型訓(xùn)練到某種輸出程度，然后打住。對(duì)于絕大多數(shù)人來(lái)說(shuō)，這就足夠用了。近期大火的巴黎創(chuàng)業(yè)公司Mistral AI，就是這么一家小模型公司。

以藍(lán)心大模型公布的參數(shù)看，1700億參數(shù)的云上大模型用于蒸餾訓(xùn)練低參數(shù)量級(jí)模型，得到70億參數(shù)的模型，把計(jì)算和推理同時(shí)放在云側(cè)和手機(jī)的端側(cè)，而10億參數(shù)模型的計(jì)算和推理只在端側(cè)。這也是高通、聯(lián)發(fā)科、英特爾和AMD們?yōu)榱藬[脫英偉達(dá)詛咒不斷在嘗試和搗鼓的。模型不塞進(jìn)手機(jī)和PC里，他們就沒(méi)機(jī)會(huì)。但能塞進(jìn)手機(jī)和PC的模型，往往不夠大，是小模型。

小模型有小模型的好處：只專(zhuān)注把幾件事做好，不做冗長(zhǎng)的信息和代碼輸出，有幾個(gè)亮點(diǎn)，其它方面則一般。比如Mistral AI，代碼寫(xiě)的就是比ChatGPT強(qiáng)。再比如藍(lán)心大模型，提煉和處理本地文檔就是比別的模型精準(zhǔn)，管理起個(gè)人手機(jī)里的文檔和日程就是更高效。其它畫(huà)圖、寫(xiě)作和搜索也都會(huì)，但并不算突出。但這又怎么樣呢？

在當(dāng)下中國(guó)討論生成式人工智能的未來(lái)，有一個(gè)詭異的現(xiàn)象：高舉高打的人不落地，落地生活的人對(duì)AI又無(wú)感。大部分人是沒(méi)用過(guò)ChatGPT的，對(duì)文心一言、通義千問(wèn)和ChatGLM可能也就是聽(tīng)說(shuō)過(guò)和偶爾一用，看不到這些玩意兒對(duì)自己有什么本質(zhì)的變化。而死磕大模型參數(shù)、規(guī)模和基準(zhǔn)測(cè)評(píng)結(jié)果的這些玩家，所有成果都放在了Hugging Face和GitHub上，幾乎從來(lái)不面向普通人做推廣，對(duì)普通人也無(wú)感。AI開(kāi)發(fā)者和用戶(hù)雙向無(wú)感，這種局面可能短期內(nèi)是無(wú)法改變的。

但如果智能手機(jī)廠商做大語(yǔ)言模型，可能就不太一樣了。主要的原因是：用戶(hù)是有感的。當(dāng)大模型內(nèi)置在操作系統(tǒng)的底層，可以隨時(shí)喚起、輔助和調(diào)用功能，就像藍(lán)心大模型長(zhǎng)在Origin OS4上那樣，用戶(hù)就會(huì)不由自主地需要它，需要它的輔助，測(cè)試它的潛力，甚至需要它的陪伴。它可能不是一個(gè)萬(wàn)能的大模型，可能就是個(gè)小模型，但是它懂它的用戶(hù)，熟悉設(shè)備里的數(shù)據(jù)，了解用戶(hù)習(xí)慣，保護(hù)用戶(hù)的隱私，能幫著排日程、打開(kāi)外賣(mài)菜單、總結(jié)文檔、挑挑照片，完成一些基礎(chǔ)寫(xiě)作，它就是大多數(shù)人“夠用”和“可信任”的AI了。

推動(dòng)大語(yǔ)言模型的普及，肯定不是通過(guò)AI編程實(shí)現(xiàn)的，也不是只有刷新SOTA評(píng)估的技術(shù)突破才能造福大多數(shù)人類(lèi)。就像鞋子合適不合適，只有穿上了才知道一樣，一個(gè)模型合適不合適，只有用了才知道。我最近這段時(shí)間在有意識(shí)地“去ChatGPT化”：閱讀論文和文檔靠Kimi Chat，案頭工作靠文心一言和ChatGLM，個(gè)人助手就靠vivo藍(lán)心大模型，不為別的，因?yàn)樗昂仙怼薄Ｄ悴黄诖C合趕超ChatGPT，但我真的是需要一個(gè)手機(jī)上能用的，保護(hù)個(gè)人隱私和數(shù)據(jù)安全的，各項(xiàng)平均分?jǐn)?shù)還過(guò)得去的“大模型”或“小模型”。

大語(yǔ)言模型是用來(lái)給人用的，又不是拿來(lái)吹牛X的。

本站提醒：投資有風(fēng)險(xiǎn)，入市須謹(jǐn)慎，本內(nèi)容不作為投資理財(cái)建議。

99ri日韩国产,日韩国产欧美另类,亚洲ⅴa在线va天堂va,青青青亚洲视频

vivo X100系列的藍(lán)心小V是我用過(guò)的最“合身”的大語(yǔ)言模型