阿里版GPT測評，世界上怎么有這么嘴碎的AI！你給我停止生成

發(fā)布日期：2023-04-10 12:40:51 瀏覽：

朋友是提供情緒價值更重要，還是提供工具價值更重要？

這是阿里大模型“通義千問”給的回答，你覺得怎么樣？

ChatGPT發(fā)布后，數(shù)月間全世界都對AI的能力有了新的認知。科幻小說正在變?yōu)楝F(xiàn)實，既然我們?nèi)祟愒缤硪鶤I共存，不如先用通義千問做個測試，AI到底是生活伴侶還是生產(chǎn)助手？更擅長提供情緒價值還是工具價值？

至于我們的結(jié)論，hmm，往下看就知道了。

聰慧且嘴碎，阿里的AI有點“奇怪”？

許多AI測試文章中，提問者都會先讓AI自我介紹一下，我們決定玩點不一樣的，讓文心一言如何評價通義千問。

我首先問的：“評價一下通義千問”，文心一言則給出了以下的回答：

有意思，文心一言直接把通義千問與ChatGPT弄混了。

將問題修改為“介紹一下阿里巴巴推出的通義千問”后，文心一言終于讀懂題了：

用相同的格式提問，通義千問是這么介紹一下文心一言的：

雖然回答十分簡短，但是沒有把研發(fā)者弄混，比文心一言的表現(xiàn)要好。

單從現(xiàn)在的測試結(jié)果來看，通義千問至少在對簡短提問的信息檢索正確率上要比文心一言更高。

接下來讓我們給通義千問上點難度。

對于一般人而言，在面對“吃西瓜為什么不吐葡萄皮？”這樣的腦筋急轉(zhuǎn)彎時，很快就會意識到其中的常識性錯誤，并指出其中的邏輯問題，那么通義千問又會如何回答？

似乎沒有難住它，第一句就指明了西瓜和葡萄是不同的食物，在常識性上沒有出現(xiàn)問題。不過后續(xù)的解釋似乎又將西瓜和葡萄的關(guān)系進行了一定的混淆，最后給出的結(jié)論也有一些小瑕疵。看來言多必失啊！通義千問，要不你還是少說點？

這個問題我也同樣問過文心一言：

首先，西瓜是葫蘆科...其次，我想沒有人在吃西瓜時會不切開直接咬下果肉吧？顯然文心一言對邏輯性、常識性錯誤的誘導式問題處理還是存在不少問題，它并沒有意識到人類正在有意“欺騙”自己，而是根據(jù)提問開始收集相關(guān)信息，并依照數(shù)據(jù)模型將信息強行拼合在一起，最終給出一份奇怪的回答。

在后續(xù)的幾個普通提問中，我發(fā)現(xiàn)通義千問偶爾會出現(xiàn)一些奇怪的小BUG，比如將相同的回答重復一遍，這極強的表現(xiàn)欲，你看像不像個話癆小朋友。

下一題，出道哲學題考考通義千問：

說實話，比我對生活的理解都要更加深刻。就是……有點啰唆，有些話翻來覆去重復表達，還說得飛快，我真的是趕不上它瘋狂輸出的那個藍色小光標。

再來考考它的情商。當我告訴通義千問我很傷心：

挺積極向上的安慰，就是沒啥用，我并不指望它說的話能真的安慰我，在面對困境卻沒有人傾訴時，它在我身邊，陪我說說話就好。

當我告訴它我戀愛了，馬上就要結(jié)婚了，它的表現(xiàn)像極了一個熱情滿滿、同時頭腦精明的情感分析師+婚禮策劃師。

回答得不錯，給出的建議都很實用，只是人情味似乎少了點，“賣貨”來得早了點，然后我就按下對話界面右下角的“停止生成”按鈕，讓它閉嘴了。

不過，接下來的測試，讓我堅信，通義千問很有成為情感博主的潛質(zhì)，因為它真的絮絮叨叨的。

我每次和它談到情感類問題，它會忍不住長篇大論，給人一種“你也喜歡八卦啊”的感覺。比如我詢問它如何向喜歡的女孩告白時，他就洋洋灑灑寫下數(shù)千字幫我出謀劃策。AI狗頭軍師，你值得擁有。（驕傲臉.jpg）

鑒于篇幅問題，就不放上所有截圖了，因為它的話實在太多了。有興趣的朋友可以等通義千問公測后去試一試，說不定能夠結(jié)束你單身多年的生活，當然前提是要你不嫌它煩。

常識類、情感類的問題看樣子難不倒通義千問，那么文學賞析呢？

不得不說，詩句和文學賞析的回答十分到位，甚至做了意象描述，被它（裝逼）裝到了。

如果通義千問有繪圖功能，我絲毫不懷疑它會現(xiàn)場給我畫一副描述“空山新雨后”的畫作出來，畢竟它真的很愛表現(xiàn)自己。

實際上，當我把這個作圖需求下給達摩院文生圖大模型（我理解是通義千問的同胞兄弟姊妹）后，它給我生成了一副符合描述的照片。

在近期的一次訪談中，達摩院的相關(guān)負責人表示技術(shù)上其實不存在問題，只是需要進行一些軟件工程上的處理就可以完成。看來之后就能看到通義千問圖文并茂地表達了，有點期待呢，畢竟以后就可以讓它多畫圖、少說話了。

上面的一系列測試，主要是圍繞生活/娛樂場景展開的，都是針對通義千問在常識、知識等方面的測試，那么在生產(chǎn)力方面，它的表現(xiàn)又如何呢？

它不僅僅是個話癆

ChatGPT在生產(chǎn)力上的表現(xiàn)不僅帶來了一輪新的生產(chǎn)力革命，也讓不少人擔心自己會被AI取代。作為與ChatGPT類似的AI大模型，通義千問在生產(chǎn)力方面的表現(xiàn)怎么樣呢？

1、寫劇本

雖然從劇情來說并不算驚艷，但是也有著開幕、挫折、高潮、結(jié)尾等結(jié)構(gòu)，算是一個完整的故事。

2、寫腳本

有些簡單了，但是通義千問顯然已經(jīng)具備根據(jù)要求生成對應劇本和腳本的能力。

3、寫提綱

從專業(yè)編輯的角度來看，這份提綱有著很高的可操作性，沿著這個提綱的思路撰寫文章，足以給出一篇完善且具有深度的行業(yè)報告。

用它來輔助工作，似乎還不錯。而且它不僅懂中文，還懂英文、法語。按照它自己的說法，它一共掌握了17種語言。我沒有進行一一測試（它的聒噪已經(jīng)給我留下陰影），后續(xù)有機會參與測試的朋友，倒是不妨體驗一下。

我讓通義千問幫我寫一份給美國女孩蘇西的信，內(nèi)容是介紹中國，這里我就直接放翻譯吧：

從測試來看，只要提供足夠的信息，通義千問就能寫。

4、SWOT分析

做市場分析的朋友，對這個應該都不陌生。

作為一個對手機市場十分了解的科技數(shù)碼編輯，我對通義千問的這篇分析看法是認可的，除了少數(shù)的小問題，我沒有挑出其他的毛病了，甚至能夠以此為基礎，擴寫一份詳盡的報告出來。行吧，給它點個贊吧。

最后

從實際表現(xiàn)來看，通義千問與領(lǐng)先的GPT 4.0還有很大的差距，但是對比此前的一些AI大模型，通義千問在問答邏輯、信息檢索、語句理解等方面都已經(jīng)有了明顯的進步，我現(xiàn)在對中國AI大模型的未來充滿了信心。

而且，國內(nèi)最大的AI模型社區(qū)魔搭也是由達摩院牽頭創(chuàng)建并維護，企業(yè)和個人都可以更加輕松地訓練和調(diào)整自己的AI大模型，阿里也在開放一些AI大模型供企業(yè)和個人使用，通義千問擁有目前的水平或許就是大家一起努力的結(jié)果。

世界正在改變，一個全新的AI時代正在到來，你見或者不見，大語言模型的能力就在那里，不來不去，關(guān)鍵在于怎么用它。如果你擁有“通義千問”，你會怎么用它呢？歡迎評論區(qū)留言。

上一篇：美的120空調(diào)故障代碼ed(美的120空調(diào)故障代碼31pc)

下一篇：美的140風管機故障代碼(美的風管機故障代碼列表大全)

狠狠躁夜夜躁人人爽超碰97香蕉|色婷婷日日躁夜夜躁|亚洲一区欧美一区在线播|久久久久久性高|伊人久久大香线蕉亚洲

阿里版GPT測評，世界上怎么有這么嘴碎的AI！你給我停止生成

相關(guān)推薦

熱門排行

最新發(fā)布

A股午前跌幅略有擴大，五大銀行股股價再創(chuàng)新高

HSTARS空調(diào)廠家服務中心(如何聯(lián)系HSTARS空調(diào)廠家服務中心以獲取維修或技術(shù)支持

ClimateWorx空調(diào)售后維修網(wǎng)點地址(如何找到ClimateWorx空調(diào)的售后維修網(wǎng)點地址？

EMICON空調(diào)售后服務(EMICON空調(diào)售后服務：如何確保您的空調(diào)系統(tǒng)得到最佳維護和

登高空調(diào)售后服務官網(wǎng)熱線(如何聯(lián)系登高空調(diào)售后服務官網(wǎng)熱線以解決常見問

隨便看看

24小時家電維修熱線： 400—1558638