狠狠躁夜夜躁人人爽超碰97香蕉|色婷婷日日躁夜夜躁|亚洲一区欧美一区在线播|久久久久久性高|伊人久久大香线蕉亚洲

歡迎來到同城快修-附近家電維修、家電清洗、家電安裝服務平臺

24小時家電維修熱線:

400—1558638

當前位置:主頁 > 電視機 > 維修資訊 >

阿里版GPT測評,世界上怎么有這么嘴碎的AI!你給我停止生成

發(fā)布日期:2023-04-10 12:40:51 瀏覽:
阿里版GPT測評,世界上怎么有這么嘴碎的AI!你給我停止生成

朋友是提供情緒價值更重要,還是提供工具價值更重要?

這是阿里大模型“通義千問”給的回答,你覺得怎么樣?

ChatGPT發(fā)布后,數(shù)月間全世界都對AI的能力有了新的認知。科幻小說正在變?yōu)楝F(xiàn)實,既然我們?nèi)祟愒缤硪鶤I共存,不如先用通義千問做個測試,AI到底是生活伴侶還是生產(chǎn)助手?更擅長提供情緒價值還是工具價值?

至于我們的結(jié)論,hmm,往下看就知道了。

聰慧且嘴碎,阿里的AI有點“奇怪”?

許多AI測試文章中,提問者都會先讓AI自我介紹一下,我們決定玩點不一樣的,讓文心一言如何評價通義千問。

我首先問的:“評價一下通義千問”,文心一言則給出了以下的回答:

有意思,文心一言直接把通義千問與ChatGPT弄混了。

將問題修改為“介紹一下阿里巴巴推出的通義千問”后,文心一言終于讀懂題了:

用相同的格式提問,通義千問是這么介紹一下文心一言的:

雖然回答十分簡短,但是沒有把研發(fā)者弄混,比文心一言的表現(xiàn)要好。

單從現(xiàn)在的測試結(jié)果來看,通義千問至少在對簡短提問的信息檢索正確率上要比文心一言更高。

接下來讓我們給通義千問上點難度。

對于一般人而言,在面對“吃西瓜為什么不吐葡萄皮?”這樣的腦筋急轉(zhuǎn)彎時,很快就會意識到其中的常識性錯誤,并指出其中的邏輯問題,那么通義千問又會如何回答?

似乎沒有難住它,第一句就指明了西瓜和葡萄是不同的食物,在常識性上沒有出現(xiàn)問題。不過后續(xù)的解釋似乎又將西瓜和葡萄的關(guān)系進行了一定的混淆,最后給出的結(jié)論也有一些小瑕疵。看來言多必失啊!通義千問,要不你還是少說點?

這個問題我也同樣問過文心一言:

首先,西瓜是葫蘆科...其次,我想沒有人在吃西瓜時會不切開直接咬下果肉吧?顯然文心一言對邏輯性、常識性錯誤的誘導式問題處理還是存在不少問題,它并沒有意識到人類正在有意“欺騙”自己,而是根據(jù)提問開始收集相關(guān)信息,并依照數(shù)據(jù)模型將信息強行拼合在一起,最終給出一份奇怪的回答。

在后續(xù)的幾個普通提問中,我發(fā)現(xiàn)通義千問偶爾會出現(xiàn)一些奇怪的小BUG,比如將相同的回答重復一遍,這極強的表現(xiàn)欲,你看像不像個話癆小朋友。

下一題,出道哲學題考考通義千問:

說實話,比我對生活的理解都要更加深刻。就是……有點啰唆,有些話翻來覆去重復表達,還說得飛快,我真的是趕不上它瘋狂輸出的那個藍色小光標。

再來考考它的情商。當我告訴通義千問我很傷心:

挺積極向上的安慰,就是沒啥用,我并不指望它說的話能真的安慰我,在面對困境卻沒有人傾訴時,它在我身邊,陪我說說話就好。

當我告訴它我戀愛了,馬上就要結(jié)婚了,它的表現(xiàn)像極了一個熱情滿滿、同時頭腦精明的情感分析師+婚禮策劃師。

回答得不錯,給出的建議都很實用,只是人情味似乎少了點,“賣貨”來得早了點,然后我就按下對話界面右下角的“停止生成”按鈕,讓它閉嘴了。

不過,接下來的測試,讓我堅信,通義千問很有成為情感博主的潛質(zhì),因為它真的絮絮叨叨的。

我每次和它談到情感類問題,它會忍不住長篇大論,給人一種“你也喜歡八卦啊”的感覺。比如我詢問它如何向喜歡的女孩告白時,他就洋洋灑灑寫下數(shù)千字幫我出謀劃策。AI狗頭軍師,你值得擁有。(驕傲臉.jpg)

鑒于篇幅問題,就不放上所有截圖了,因為它的話實在太多了。有興趣的朋友可以等通義千問公測后去試一試,說不定能夠結(jié)束你單身多年的生活,當然前提是要你不嫌它煩。

常識類、情感類的問題看樣子難不倒通義千問,那么文學賞析呢?

不得不說,詩句和文學賞析的回答十分到位,甚至做了意象描述,被它(裝逼)裝到了。

如果通義千問有繪圖功能,我絲毫不懷疑它會現(xiàn)場給我畫一副描述“空山新雨后”的畫作出來,畢竟它真的很愛表現(xiàn)自己。

實際上,當我把這個作圖需求下給達摩院文生圖大模型(我理解是通義千問的同胞兄弟姊妹)后,它給我生成了一副符合描述的照片。

在近期的一次訪談中,達摩院的相關(guān)負責人表示技術(shù)上其實不存在問題,只是需要進行一些軟件工程上的處理就可以完成。看來之后就能看到通義千問圖文并茂地表達了,有點期待呢,畢竟以后就可以讓它多畫圖、少說話了。

上面的一系列測試,主要是圍繞生活/娛樂場景展開的,都是針對通義千問在常識、知識等方面的測試,那么在生產(chǎn)力方面,它的表現(xiàn)又如何呢?

它不僅僅是個話癆

ChatGPT在生產(chǎn)力上的表現(xiàn)不僅帶來了一輪新的生產(chǎn)力革命,也讓不少人擔心自己會被AI取代。作為與ChatGPT類似的AI大模型,通義千問在生產(chǎn)力方面的表現(xiàn)怎么樣呢?

1、寫劇本

雖然從劇情來說并不算驚艷,但是也有著開幕、挫折、高潮、結(jié)尾等結(jié)構(gòu),算是一個完整的故事。

2、寫腳本

有些簡單了,但是通義千問顯然已經(jīng)具備根據(jù)要求生成對應劇本和腳本的能力。

3、寫提綱

從專業(yè)編輯的角度來看,這份提綱有著很高的可操作性,沿著這個提綱的思路撰寫文章,足以給出一篇完善且具有深度的行業(yè)報告。

用它來輔助工作,似乎還不錯。而且它不僅懂中文,還懂英文、法語。按照它自己的說法,它一共掌握了17種語言。我沒有進行一一測試(它的聒噪已經(jīng)給我留下陰影),后續(xù)有機會參與測試的朋友,倒是不妨體驗一下。

我讓通義千問幫我寫一份給美國女孩蘇西的信,內(nèi)容是介紹中國,這里我就直接放翻譯吧:

從測試來看,只要提供足夠的信息,通義千問就能寫。

4、SWOT分析

做市場分析的朋友,對這個應該都不陌生。

作為一個對手機市場十分了解的科技數(shù)碼編輯,我對通義千問的這篇分析看法是認可的,除了少數(shù)的小問題,我沒有挑出其他的毛病了,甚至能夠以此為基礎,擴寫一份詳盡的報告出來。行吧,給它點個贊吧。

最后

從實際表現(xiàn)來看,通義千問與領(lǐng)先的GPT 4.0還有很大的差距,但是對比此前的一些AI大模型,通義千問在問答邏輯、信息檢索、語句理解等方面都已經(jīng)有了明顯的進步,我現(xiàn)在對中國AI大模型的未來充滿了信心。

而且,國內(nèi)最大的AI模型社區(qū)魔搭也是由達摩院牽頭創(chuàng)建并維護,企業(yè)和個人都可以更加輕松地訓練和調(diào)整自己的AI大模型,阿里也在開放一些AI大模型供企業(yè)和個人使用,通義千問擁有目前的水平或許就是大家一起努力的結(jié)果。

世界正在改變,一個全新的AI時代正在到來,你見或者不見,大語言模型的能力就在那里,不來不去,關(guān)鍵在于怎么用它。如果你擁有“通義千問”,你會怎么用它呢?歡迎評論區(qū)留言。

主站蜘蛛池模板: 人妻人人澡人人添人人爽人人玩| 亚洲一区av在线观看| 久久精品国亚洲a∨麻豆| 中文字幕巨大的乳专区| 亚洲日韩中文字幕在线播放| 午夜一区二区免费| 欧美一区二区一级视频免费看| 亚洲欧洲免费无码| 无码人妻aⅴ一区二区三区蜜桃 | 亚洲精品无码午夜福利中文字幕| 国产av一区二区精品播放| 51国偷自产一区二区三区| 亚洲精品国产第一综合99久久| 男人到天堂在线a无码| 色天使亚洲综合一区二区| 成人爽a毛片免费| 国产首页一区二区| 天干天干夜天干天天爽| 久久不见久久见www日本 | 精品人妻一区二区三区视频53一| а√天堂8资源在线官网| 久久人人爽人人爽人人片av麻烦| 少妇被躁爽到高潮无码文| 久久无码av一区二区三区电影网| 久久国产精久久精产国| 99欧美精品一区二区| 亚洲欧美成人综合图区| 亚洲欧美综合在线一区| а中文在线天堂| 成人国产一区二区三区精品| 国产精品爽爽ⅴa在线观看| 无码国产激情在线观看| 丝袜美腿丝袜亚洲综合| 欧美日韩大片一区二区三区| 亚洲成av人影院在线观看网| 精品无人区一区二区三区| 东京热av一区| 国产av一码二码三码无码 | 亚洲xxxx做受欧美| 无码日韩精品一区二区人妻| 未满十八18禁止免费网站|