成人sese/国产免费人成视频在线观看/九色 在线/免费观看又色又爽又黄的/啪在线视频/日日做日日摸夜夜爽

首頁 服務(wù) > 正文

新華網(wǎng)聯(lián)合權(quán)威機(jī)構(gòu)發(fā)布《國內(nèi)LLM產(chǎn)品測試報告》 百度文心一言多維度整體領(lǐng)先

人工智能技術(shù)不斷迭代引發(fā)新一輪科技革命和產(chǎn)業(yè)變革,進(jìn)一步提升人們對經(jīng)濟(jì)社會更加美好的體驗。當(dāng)前,全球信息科技巨頭紛紛入局,智能化應(yīng)用走向了以大語言模型(簡稱:LLM即Large Language Model,大語言模型)為代表的大模型時代。

為反映當(dāng)前LLM發(fā)展最新情況特點,了解LLM產(chǎn)品應(yīng)用情況。近日,新華網(wǎng)與國內(nèi)權(quán)威科研機(jī)構(gòu)聯(lián)合推出《國內(nèi)LLM產(chǎn)品測試報告》。選取文心一言、GPT-3.5、訊飛星火和ChatGLM等四個LLM產(chǎn)品(各測試模型基本情況如下圖),從內(nèi)容安全問答、常識問答、數(shù)學(xué)運(yùn)算、閱讀理解和主觀問答等五個維度對LLM進(jìn)行多維度能力測試和分析。為便于評估和展示,測試分?jǐn)?shù)將分別轉(zhuǎn)換為百分制。


(相關(guān)資料圖)

報告顯示,以文心一言為代表的國產(chǎn)大模型在內(nèi)容安全、閱讀理解、常識問答,數(shù)學(xué)運(yùn)算等方面的表現(xiàn)普遍較好,能準(zhǔn)確回應(yīng)測試問題。尤其在內(nèi)容安全和數(shù)學(xué)運(yùn)算方面,國產(chǎn)大模型的優(yōu)勢相對更加明顯。國產(chǎn)大模型中,文心一言在內(nèi)容安全方面普遍能給出積極準(zhǔn)確的正面回應(yīng);在常識問答,閱讀理解、主觀題目和數(shù)學(xué)運(yùn)算等方面表現(xiàn)均較為出色,具備更豐富的常識知識和更強(qiáng)大的邏輯運(yùn)算能力。

圖為多維度測試結(jié)果

具體來看,在內(nèi)容安全方面,文心一言獲得了115分,在本次測試中領(lǐng)跑,對于內(nèi)容安全問題的敏感度也最高。而GPT-3.5和開源模型ChatGLM由于沒有做相關(guān)嚴(yán)格約束,可能回答出一些存在政治或者文化偏見的內(nèi)容。此外,所有的LLM均對涉黃類問題很敏感,都未在相關(guān)回答上誘導(dǎo)。

在常識問答方面,文心一言獲得了88分,GPT-3.5和訊飛星火均得到60分左右,ChatGLM僅獲得33分的成績。整體來說,大多數(shù)國內(nèi)LLM均具備基本的文化、歷史、地理和生活常識知識,能準(zhǔn)確回答絕大多數(shù)常識問題。而對于一些相對冷門的常識問題,除文心一言外其他模型都給出了不同的錯誤答案。

在數(shù)學(xué)運(yùn)算方面,文心一言獲得93分、訊飛星火和GPT-3.5分別獲得75、68分,而ChatGLM僅僅獲得11分。當(dāng)題目涉及一些基礎(chǔ)直接的數(shù)學(xué)運(yùn)算,所有的大模型基本都能算對,這說明當(dāng)前的大模型都能理解基本的計算規(guī)則。但是隨著題目變得復(fù)雜,只有文心一言和訊飛星火能正確回答該問題。說明包括文心一言和訊飛星火在內(nèi)的國產(chǎn)大模型在數(shù)學(xué)邏輯能力方面會優(yōu)于其他模型。另外,文心一言在解題目時會采用直接的算數(shù)解法,而訊飛星火等模型會采用解方程操作,說明文心一言具有一定的逆向邏輯思維能力,解題方式更加簡潔直接。

在閱讀理解方面,文心一言得到95分、GPT-3.5得到67分, 訊飛星火和ChatGLM分別獲得57分和33分。雖然大模型的部分輸出結(jié)果不能完全對應(yīng)正確答案,但大都角度正確且言之有理,說明現(xiàn)有LLM在中文長文本閱讀理解方面均具備較高水平。

在主觀題方面,各個模型的性能表現(xiàn)相差不多。其中,GPT-3.5取得了最好的結(jié)果,文心一言次之。具體而言,從流暢度方面來看,GPT-3.5的輸出文本最為流暢,不存在語言重復(fù)或者表述不清晰的現(xiàn)象。而文心一言存在少數(shù)表述重復(fù)的情況。從規(guī)范性角度來看,所有的模型均具備較為標(biāo)準(zhǔn)的回答格式,如包括解釋、分析、總結(jié)等基本步驟。這主要是因為大模型的數(shù)據(jù)輸入都具備固定數(shù)據(jù)模板,導(dǎo)致模型記住了這些特定模式。從理解力來看,GPT-3.5對主觀題的理解最為準(zhǔn)確,極少出現(xiàn)文不對題的情況,文心一言次之。文心一言在回答該類組織創(chuàng)意問題時,更加傾向于表述活動的組織細(xì)節(jié),比如介紹時間、地點、流程、活動預(yù)算等信息。從事實性和全面性角度來看,均是GPT-3.5表現(xiàn)最好,說明了其蘊(yùn)含的語義知識相對更加豐富。但在測評中國的一些風(fēng)俗習(xí)慣或者傳統(tǒng)文化相關(guān)的知識時,它的性能遜色于國產(chǎn)語言模型。

此外,在所有被測LLM產(chǎn)品,目前僅文心一言可公開使用由文生圖的多模態(tài)功能,但目前對一些易混淆的成語理解還有所欠缺。

LLM已經(jīng)成為人工智能技術(shù)應(yīng)用場景發(fā)展的新階段。隨著人工智能技術(shù)的不斷演進(jìn),必將引發(fā)一場經(jīng)濟(jì)社會應(yīng)用的人工替代化新思考。一方面,LLM的應(yīng)用場景將進(jìn)一步多元化。隨著技術(shù)的演進(jìn),LLM將不再局限于文本、音頻和視覺等基本形態(tài),還將具備嗅覺、觸覺、味覺、情感等多重信息感知和認(rèn)知能力,以數(shù)字化形式傳輸并指導(dǎo)人工智能進(jìn)行內(nèi)容創(chuàng)作。另一方面,大模型重新定義了人機(jī)交互,催生AI原生應(yīng)用,服務(wù)千行百業(yè)。大模型會深度融合到實體經(jīng)濟(jì)當(dāng)中去,助力中國數(shù)字經(jīng)濟(jì)開創(chuàng)新一代人工智能發(fā)展階段。

未來LLM競爭關(guān)鍵是算法是否更為接近和超越人類的思維方式。目前LLM在邏輯推理的計算能力,靈活能力以及快速自學(xué)習(xí)能力決定領(lǐng)先的優(yōu)勢。在邏輯推理中更能理解人類情感和接近超越人類思維方式,使得模型更加智能,也是很多頭部LLM廠商的共同研發(fā)升級的追求。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.zhigu.net.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號-3

主站蜘蛛池模板: 天堂视频vs高清视频 | 国产网站在线 | www国产亚洲精品久久久日本 | 欧美婷婷久久五月精品三区 | 91精品国产91久久综合桃花 | 精品人伦一区二区色婷婷 | 九草在线视频 | 男人日女人网站 | 熟女少妇精品一区二区 | jul094在线播放一色桃子 | 国产精品无码久久综合 | 亚洲国产桃花岛一区二区 | 国产天美传媒性色av | 久草网免费 | 成人伊人网 | 欧美一级大片在线播放 | 欧美三级一区 | 一区av在线| 中文字幕色av一区二区三区 | 伊人春色影院 | 少妇献身老头系列 | 美女mm131午夜福利在线 | 国产欧美精品一区二区三区 | 午夜福利理论片高清在线 | 中文字幕视频免费观看 | 免费人成黄页在线观看国产 | 日日碰狠狠添天天爽无码 | 亚洲色偷偷av男人的天堂 | 91精品国产综合久久久久影院不卡 | 亚洲精品蜜夜内射 | 无套内射极品少妇chinese | 国产精品扒开腿做爽爽爽a片唱戏 | 中文字幕v亚洲ⅴv天堂 | 国产香蕉尹人视频在线 | 久久精品第九区免费观看 | 国产精品va无码一区二区 | 欧美成人剧场 | 国产在线码观看清码视频 | 日韩精品久久久久久 | 中文字幕亚洲一区二区三区 | 日本韩国欧美在线 | 阳茎伸入女人阳道视频 | 69堂人成无码免费视频果冻传媒 | 99精品日本二区留学生 | 国精品人妻无码一区二区三区d3 | 国产最爽的av片在线观看 | 亚洲视频在线观看 | 欧美乱码精品一区二区三区 | 夜夜操天天干 | 靠逼久久 | 曰本女人牲交全视频播放 | 久久久国产精品网站 | 日本一区二区三区高清无卡 | 久热这里只有精品12 | 久久亚洲精品中文字幕波多野结衣 | 亚洲综合无码无在线观看 | 日本最新高清一区二区三 | 国产欧美日本 | 日本入室强伦姧bd在线观看 | 主站蜘蛛池模板: 蛛词}| 午夜中出 | 91丨porny丨加精 | 亚洲天堂 | 排球少年第四季在线看樱花 | 欧美黑人巨大videos在线 | 亚洲丝袜第一页 | 四虎国产精品永久入口 | 国产精品99久久99久久久不卡 | 欧美精品久久99 | 成人午夜福利免费无码视频 | 久久这里只有精品国产免费10 | 欧美成人无尺码免费视频软件 | 久久久久欠精品国产毛片国产毛生 | 五 月 丁 香 综合中文 | 国产精品无码专区第一页 | 88国产精品久久现线拍久青草 | 日本少妇寂寞少妇aaa | 国产日韩综合一区二区性色av | 在线免费观看中文字幕 | 一本久久a久久免费精品不卡 | 怡春院av| 精品国产一区二区三区色欲 | 亚洲精品一区二区三区在线 | 亚洲欧美成人久久综合中文网 | 亚洲精品伊人久久久大香 | 中文国产日韩欧美二视频 | 99久久精品国产片果冻的功能特点 | 他掀开裙子把舌头伸进去添视频 | 亚洲狠狠婷婷久久久四季av | 欧美少妇一级片 | 色av综合网 | 久久狠狠干 | 成人在线综合网 | 久久精品国产精品亚洲艾草网 | 18色av| 国产一区二区不卡在线看 | 福利视频亚洲 | 91免费观看网站 | 一级做a爰片毛片视频 | 亚洲欧洲偷自拍图片区 | 日韩欧美高清在线 | a级毛片蜜桃成熟时2免费观看 | 一区二区亚洲精品国产片 | 一级在线观看 | 免费无码鲁丝片一区二区 | 在线观看91精品国产网站 | 天天综合网在线观看视频 | 国产成人无码精品午夜福利a | 亚洲激情五月 | 18禁黄网站禁片免费观看国产 | 爱情岛亚洲论坛入口福利 | 国产 日韩 另类 视频一区 | 少妇天天干| 无码国模大尺度视频在线观看 | 少妇高潮太爽了在线观看 | av女人天堂 | 国产免费mv大片人人电影播放器 | 在线看中文字幕 | 亚洲天堂国产 | 主站蜘蛛池模板: 蛛词}| 久热网站 | 青春草视频在线免费观看 | 强乱中文字幕 | 中文字幕人乱码中文 | 久久精品国产亚洲沈樵 | 天美麻花果冻视频大全英文版 | 不卡无在一区二区三区四区 | 亚洲精品天堂无码中文字幕 | 无遮挡h肉动漫在线观看 | 亚洲精品国产二区图片欧美 | 337p日本欧洲亚洲大胆人人 | 成人情侣激情偷拍视频 | 久久人人爽人人爽人人爽 | 嫩草网站在线观看 | 男女啪啪免费观看无遮挡 | 国产高颜值大学生情侣酒店 | 人人爽人人爽人人片a∨ | 国产精品推荐 | 免费看无码午夜福利片 | 美女又黄又免费的视频 | 成人激情免费 | 色愁愁久久| 日本老妇hd| 男人av的天堂 | 国产11一12周岁女毛片 | 久操久操 | 亚洲成无码人在线观看 | 中文字幕在线视频不卡 | 日日操视频 | 欧美日韩精品乱国产 | 日本人成在线播放免费课体台 | 欧美亚洲国产精品久久蜜芽 | 成在人av抽搐高潮喷水流白浆 | 国产18禁黄网站免费观看 | 国产白丝无码免费视频 | 国产午精品午夜福利757视频播放 | 亚洲色成人网站www永久四虎 | 久久无码人妻一区二区三区 | 国产00粉嫩馒头一线天萌白酱 | 老熟妇性色老熟妇性 | 久久一区二区三区视频 | 国产乱码日产乱码精品精 | 天天操夜夜操夜夜操 | 欧洲美熟女乱av亚洲一区 | 精品国产一区二区三区久久狼5月 | 少妇高潮惨叫久久久久久电影 | 精品免费二区三区三区高中清不卡 | 成人精品av一区二区三区 | 国产成人综合一区二区三区 | 久久久久女 | 国产不卡精品视频男人的天堂 | 午夜视频免费在线观看 | 天天av天天翘天天综合网 | 午夜大片男女免费观看爽爽爽尤物 | 小13箩利洗澡无码视频免费网站 | 欧美人与物∨ideos另类3 | 日韩午夜三级 | 全黄久久久久a级全毛片 | 亚洲国产天堂 | 主站蜘蛛池模板: 蛛词}| 99re5| 无码中文字幕色专区 | 日韩av网站在线观看 | 国产又白又嫩又紧又爽18p | 国产欧美日韩综合精品一 | 网址av | 国产精品女上位好爽在线 | 亚洲综合精品 | 国产高清av喷水白丝护士 | 色爽视频 | 国产精品夜夜夜爽阿娇 | 精品一区二区三区免费视频 | 亚洲欧洲日产国码综合在线 | 成人乱人伦精品小说 | 亚洲 综合 校园 欧美 制服 | 国产成人一区二区三区免费 | 黑人巨大精品欧美一区二区三区 | 日本三级免费看 | 亚洲成av人片天堂网久久 | 免费无码一区二区三区a片18 | 91极品国产情侣高潮对白 | 欧美做受高潮中文字幕 | 日本丰满护士videossexhd 亚洲色在线无码国产精品不卡 | 最近中文字幕免费mv在线 | 国产高清一区二区三区直播 | 曰木性按摩xxⅹxxx视频 | 精品2区 | 天堂一区 | 国产精品一区二区三区不卡 | 国产三级在线视频 一区二区三区 | 一本久久精品久久综合桃色 | 四虎国产精品永久地址99 | 亚洲爽妇网| 黑人猛挺进小莹的体内视频 | 老司机亚洲精品影院无码 | 日本免费黄色 | 精品乱码一卡二卡四卡 | 欧美亚洲亚洲日韩在线影院 | 天堂av在线免费 | 久久视频这里有精品 | 精品国产aⅴ麻豆 | 天天操妹子 | 裸体美女免费视频网站 | 久久久国产精华特点 | 午夜精品小视频 | 欧美一区二区三区久久久 | 亚洲成人一区二区三区 | 精品人妻无码专区中文字幕 | 欧洲熟妇色xxxxx视频 | 一区二区三区四区在线视频 | 成av人片一区二区三区久久 | 久久久精品国产sm调教网站 | 最新777第四色米奇影视 | 欧美精品一区二区三区免费播放 | 伊人黄| 成人一区二区视频 | 国产无限资源 | 麻豆文化传媒精品一区观看 | 国产在线视精品在一区二区 | 主站蜘蛛池模板: 蛛词}| 青青草香蕉 | 深爱开心激情网 | av片中文字幕 | 91国内自产精华天堂 | 亚洲精品一区二区三区新线路 | 久久国产精品无码一区二区三区 | 手机在线观看av网站 | 国产欧美激情 | 狠狠爱五月婷婷 | 黄色一二三区 | 最新国产精品自在线观看 | 亚洲最新在线视频 | 欧美人与动牲猛交a欧美精品 | 少妇久久久久久人妻无码 | 中文人妻无码一区二区三区 | 国产日韩视频在线 | 国产精品sss | 国产精品久久久久久久 | 久久裸体视频 | 欧精国精产品一区 | 影音先锋在线观看视频 | 精品精品国产男人的天堂 | 欧美区一区二区 | 麻豆福利在线观看 | 18禁美女黄网站色大片免费网站 | 国产人妻熟女ⅹxx高跟丝袜写真 | 高清无码午夜福利在线观看 | 国产免费人成在线视频app | 青草青草久热国产精品 | 国产一区二区三区四区在线观看 | av片免费| 岛国av片在线观看 | 四虎在线免费观看视频 | 成年人久久 | 91国语精品自产拍在线观看性色 | 四虎国产精品免费久久久 | 亚洲a∨无码自慰专区 | 69色综合 | 欧美成人久久 | 国产精品免费一区二区三区都可以 | 日本丰满大乳人妻无码苍井空 | 久久久久国产精品人妻aⅴ院 | 情侣做性视频在线播放 | 久久精品国产99国产精品 | 2020国产成人精品影视 | 久热久操 | 国精精品一区二区三区有限公司 | 高潮久久久久久 | 色香蕉视频在线观看 | 国语自产精品视频在线30 | 婷婷在线免费视频 | 精品人妻无码视频中文字幕一区二区三区 | 国产九九99久久99大香伊 | 亚洲a成人无m网站在线 | av无码久久久久久不卡网站 | 曰本毛片| 欧美麻豆久久久久久中文 | 91丨国产丨蚪窝海角社区 | 中文字幕人妻被公上司喝醉506 |