阿里版GPT測評,世界上怎么有這么嘴碎的AI!你給我停止生成
朋友是提供情緒價值更重要,還是提供工具價值更重要?
這是阿里大模型“通義千問”給的回答,你覺得怎么樣?
ChatGPT發(fā)布后,數(shù)月間全世界都對AI的能力有了新的認知。科幻小說正在變?yōu)楝F(xiàn)實,既然我們?nèi)祟愒缤硪鶤I共存,不如先用通義千問做個測試,AI到底是生活伴侶還是生產(chǎn)助手?更擅長提供情緒價值還是工具價值?
至于我們的結(jié)論,hmm,往下看就知道了。
聰慧且嘴碎,阿里的AI有點“奇怪”?許多AI測試文章中,提問者都會先讓AI自我介紹一下,我們決定玩點不一樣的,讓文心一言如何評價通義千問。
我首先問的:“評價一下通義千問”,文心一言則給出了以下的回答:
有意思,文心一言直接把通義千問與ChatGPT弄混了。
將問題修改為“介紹一下阿里巴巴推出的通義千問”后,文心一言終于讀懂題了:
用相同的格式提問,通義千問是這么介紹一下文心一言的:
雖然回答十分簡短,但是沒有把研發(fā)者弄混,比文心一言的表現(xiàn)要好。
單從現(xiàn)在的測試結(jié)果來看,通義千問至少在對簡短提問的信息檢索正確率上要比文心一言更高。
接下來讓我們給通義千問上點難度。
對于一般人而言,在面對“吃西瓜為什么不吐葡萄皮?”這樣的腦筋急轉(zhuǎn)彎時,很快就會意識到其中的常識性錯誤,并指出其中的邏輯問題,那么通義千問又會如何回答?
似乎沒有難住它,第一句就指明了西瓜和葡萄是不同的食物,在常識性上沒有出現(xiàn)問題。不過后續(xù)的解釋似乎又將西瓜和葡萄的關(guān)系進行了一定的混淆,最后給出的結(jié)論也有一些小瑕疵。看來言多必失啊!通義千問,要不你還是少說點?
這個問題我也同樣問過文心一言:
首先,西瓜是葫蘆科...其次,我想沒有人在吃西瓜時會不切開直接咬下果肉吧?顯然文心一言對邏輯性、常識性錯誤的誘導式問題處理還是存在不少問題,它并沒有意識到人類正在有意“欺騙”自己,而是根據(jù)提問開始收集相關(guān)信息,并依照數(shù)據(jù)模型將信息強行拼合在一起,最終給出一份奇怪的回答。
在后續(xù)的幾個普通提問中,我發(fā)現(xiàn)通義千問偶爾會出現(xiàn)一些奇怪的小BUG,比如將相同的回答重復一遍,這極強的表現(xiàn)欲,你看像不像個話癆小朋友。
下一題,出道哲學題考考通義千問:
說實話,比我對生活的理解都要更加深刻。就是……有點啰唆,有些話翻來覆去重復表達,還說得飛快,我真的是趕不上它瘋狂輸出的那個藍色小光標。
再來考考它的情商。當我告訴通義千問我很傷心:
挺積極向上的安慰,就是沒啥用,我并不指望它說的話能真的安慰我,在面對困境卻沒有人傾訴時,它在我身邊,陪我說說話就好。
當我告訴它我戀愛了,馬上就要結(jié)婚了,它的表現(xiàn)像極了一個熱情滿滿、同時頭腦精明的情感分析師+婚禮策劃師。
回答得不錯,給出的建議都很實用,只是人情味似乎少了點,“賣貨”來得早了點,然后我就按下對話界面右下角的“停止生成”按鈕,讓它閉嘴了。
不過,接下來的測試,讓我堅信,通義千問很有成為情感博主的潛質(zhì),因為它真的絮絮叨叨的。
我每次和它談到情感類問題,它會忍不住長篇大論,給人一種“你也喜歡八卦啊”的感覺。比如我詢問它如何向喜歡的女孩告白時,他就洋洋灑灑寫下數(shù)千字幫我出謀劃策。AI狗頭軍師,你值得擁有。(驕傲臉.jpg)
鑒于篇幅問題,就不放上所有截圖了,因為它的話實在太多了。有興趣的朋友可以等通義千問公測后去試一試,說不定能夠結(jié)束你單身多年的生活,當然前提是要你不嫌它煩。
常識類、情感類的問題看樣子難不倒通義千問,那么文學賞析呢?
不得不說,詩句和文學賞析的回答十分到位,甚至做了意象描述,被它(裝逼)裝到了。
如果通義千問有繪圖功能,我絲毫不懷疑它會現(xiàn)場給我畫一副描述“空山新雨后”的畫作出來,畢竟它真的很愛表現(xiàn)自己。
實際上,當我把這個作圖需求下給達摩院文生圖大模型(我理解是通義千問的同胞兄弟姊妹)后,它給我生成了一副符合描述的照片。
在近期的一次訪談中,達摩院的相關(guān)負責人表示技術(shù)上其實不存在問題,只是需要進行一些軟件工程上的處理就可以完成。看來之后就能看到通義千問圖文并茂地表達了,有點期待呢,畢竟以后就可以讓它多畫圖、少說話了。
上面的一系列測試,主要是圍繞生活/娛樂場景展開的,都是針對通義千問在常識、知識等方面的測試,那么在生產(chǎn)力方面,它的表現(xiàn)又如何呢?
它不僅僅是個話癆ChatGPT在生產(chǎn)力上的表現(xiàn)不僅帶來了一輪新的生產(chǎn)力革命,也讓不少人擔心自己會被AI取代。作為與ChatGPT類似的AI大模型,通義千問在生產(chǎn)力方面的表現(xiàn)怎么樣呢?
1、寫劇本
雖然從劇情來說并不算驚艷,但是也有著開幕、挫折、高潮、結(jié)尾等結(jié)構(gòu),算是一個完整的故事。
2、寫腳本
有些簡單了,但是通義千問顯然已經(jīng)具備根據(jù)要求生成對應劇本和腳本的能力。
3、寫提綱
從專業(yè)編輯的角度來看,這份提綱有著很高的可操作性,沿著這個提綱的思路撰寫文章,足以給出一篇完善且具有深度的行業(yè)報告。
用它來輔助工作,似乎還不錯。而且它不僅懂中文,還懂英文、法語。按照它自己的說法,它一共掌握了17種語言。我沒有進行一一測試(它的聒噪已經(jīng)給我留下陰影),后續(xù)有機會參與測試的朋友,倒是不妨體驗一下。
我讓通義千問幫我寫一份給美國女孩蘇西的信,內(nèi)容是介紹中國,這里我就直接放翻譯吧:
從測試來看,只要提供足夠的信息,通義千問就能寫。
4、SWOT分析
做市場分析的朋友,對這個應該都不陌生。
作為一個對手機市場十分了解的科技數(shù)碼編輯,我對通義千問的這篇分析看法是認可的,除了少數(shù)的小問題,我沒有挑出其他的毛病了,甚至能夠以此為基礎,擴寫一份詳盡的報告出來。行吧,給它點個贊吧。
最后
從實際表現(xiàn)來看,通義千問與領(lǐng)先的GPT 4.0還有很大的差距,但是對比此前的一些AI大模型,通義千問在問答邏輯、信息檢索、語句理解等方面都已經(jīng)有了明顯的進步,我現(xiàn)在對中國AI大模型的未來充滿了信心。
而且,國內(nèi)最大的AI模型社區(qū)魔搭也是由達摩院牽頭創(chuàng)建并維護,企業(yè)和個人都可以更加輕松地訓練和調(diào)整自己的AI大模型,阿里也在開放一些AI大模型供企業(yè)和個人使用,通義千問擁有目前的水平或許就是大家一起努力的結(jié)果。
世界正在改變,一個全新的AI時代正在到來,你見或者不見,大語言模型的能力就在那里,不來不去,關(guān)鍵在于怎么用它。如果你擁有“通義千問”,你會怎么用它呢?歡迎評論區(qū)留言。
- 1維修ca3046電路(應該注意哪些細節(jié))。
- 2格力多聯(lián)機顯示c0(如何解決這個故障代碼)。
- 3bosch熱水器常見故障(Bosch熱水器常見故障解析)
- 4TAADA空氣能售后服務電話(TAADA空氣能售后服務電話:專業(yè)解決您的問題)
- 5華樂仕智能鎖沒電打不開怎么辦(華樂仕智能鎖沒電怎么辦)
- 6多田空氣能全國服務熱線(多田空氣能服務熱線,全國矢志服務到底!)
- 7柯豐防盜門廠家電話(柯豐防盜門廠家電話:安全保障盡在掌握)
- 8帥邦油煙機維修服務(帥邦油煙機使用)
- 9美的空調(diào)沒熱風怎么辦(解決美的空調(diào)無熱風問題)
- 10森田集成灶維修電話(森田集成灶,快速修理電話)
-
A股午前跌幅略有擴大,五大銀行股股價再創(chuàng)新高
2024-08-27