亚洲爆乳中文字幕无码专区网站-黄页网站视频-暖暖 免费 高清 日本 在线-97亚洲熟妇自偷自拍另类图片-国产av久久久久精东av

EN

AI答案也會(huì)出錯(cuò)?明略科技如何用事實(shí)性數(shù)據(jù)反AI幻覺

2025-02-25

前段時(shí)間,一組關(guān)于80后死亡率的數(shù)據(jù)在網(wǎng)上引發(fā)廣泛關(guān)注。不少自媒體為追逐流量熱度,不斷渲染炒作,助長(zhǎng)了這些離譜數(shù)據(jù)的傳播。近日,央視新聞等權(quán)威媒體以及相關(guān)專家紛紛辟謠,指出這一數(shù)據(jù)與事實(shí)嚴(yán)重不符。

專家表示,第七次全國(guó)人口普查的時(shí)間是2020年,其結(jié)果顯然無法預(yù)測(cè)2024年的死亡率。此外,人口普查數(shù)據(jù)只會(huì)公布對(duì)應(yīng)時(shí)期的死亡率,例如2020年的第七次全國(guó)人口普查,反映的是2019年11月1日至2020年10月31日的死亡率,并不存在針對(duì)特定群體(如“80后”)的累積死亡狀況統(tǒng)計(jì)。對(duì)于網(wǎng)絡(luò)上出現(xiàn)的“5.2%”的死亡率數(shù)據(jù),錯(cuò)誤非常明顯。因?yàn)閷I(yè)統(tǒng)計(jì)數(shù)據(jù)中,死亡率通常以千分率表示,而不是百分率,此外相關(guān)內(nèi)容,還存在其他定義混淆等專業(yè)常識(shí)上的明顯錯(cuò)誤。

隨著中國(guó)網(wǎng)民突破11億,其中約2.5億人已成為生成式AI用戶。AI在帶來紅利的同時(shí),也帶來了風(fēng)險(xiǎn)與挑戰(zhàn)。

AI為何會(huì)出錯(cuò)?

科普中國(guó)曾指出,就像我們?cè)诳荚嚂r(shí)遇到不會(huì)的題目,我們會(huì)試圖用已知知識(shí)去推測(cè)答案一樣,AI在遇到信息缺失或不確定的情況時(shí),會(huì)基于自己的“經(jīng)驗(yàn)”(訓(xùn)練數(shù)據(jù))進(jìn)行填補(bǔ)和推理。這不是因?yàn)锳I想要欺騙我們,而是它在試圖用自己的理解的模式來完成這個(gè)任務(wù)。

大模型的認(rèn)知來源于數(shù)據(jù),這些數(shù)據(jù)來自公開數(shù)據(jù)集、互聯(lián)網(wǎng)爬取的數(shù)據(jù),以及自有或第三方數(shù)據(jù)。

然而,由于訓(xùn)練語料、數(shù)據(jù)來源不足等多重因素,AI大模型也存在認(rèn)知上的不足,難免生成錯(cuò)誤或虛假信息,也就是業(yè)內(nèi)常說的“幻覺”。

“最主要的原因在于,大模型的根本原理是對(duì)下一個(gè)token的預(yù)測(cè)。既然是預(yù)測(cè),那么就是選擇概率相對(duì)最大的路徑進(jìn)行推理,而這條路徑并不包含“事實(shí)”和“邏輯推理”?!泵髀钥萍枷嚓P(guān)專家指出。

企業(yè)如何應(yīng)對(duì)AI幻覺?

隨著新進(jìn)國(guó)民頂流DeepSeek的爆火,AI已在全民范圍實(shí)現(xiàn)了破圈,而企業(yè)對(duì)AI賦能業(yè)務(wù)的需求也愈發(fā)迫切。然而,專業(yè)領(lǐng)域?qū)I輸出信息的真實(shí)性、準(zhǔn)確性要求更為嚴(yán)格。那么在實(shí)際業(yè)務(wù)場(chǎng)景中,企業(yè)如何取其長(zhǎng)處、避其短處,讓AI更好地為業(yè)務(wù)服務(wù)呢?

明略科技相關(guān)專家表示,AI有不同的應(yīng)用場(chǎng)景,有的需要發(fā)散和想象,有的則需要嚴(yán)謹(jǐn)和收斂。企業(yè)場(chǎng)景大多要確保答案嚴(yán)謹(jǐn)、有根據(jù),不能出錯(cuò)。

企業(yè)可以通過選用特定模型、給定所需材料、增加指令引導(dǎo)等三種主要方式來緩解AI幻覺:

01 選用特定模型

指令遵從和總結(jié)引用上表現(xiàn)較好的模型,在訓(xùn)練時(shí)往往偏向“引用原文”回答。因此用戶在AI給出的答案中可以看到更多原文內(nèi)容,而非AI自由發(fā)揮的結(jié)果。

02 給定所需材料

加入與問題相關(guān)的材料和信息,AI便可以判斷材料與問題之間的關(guān)系,并傾向于使用給定材料進(jìn)行回答。

03 增加指令引導(dǎo)

明確約束,告訴AI要基于已有事實(shí)回答,不要進(jìn)行推測(cè);標(biāo)注不確定,對(duì)于模糊信息,需標(biāo)注“此處為推測(cè)內(nèi)容”等。

從模型角度來看,GPT-4等模型幻覺較少的原因在于:一是增強(qiáng)訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,相當(dāng)于用高質(zhì)量語料,覆蓋更多用戶場(chǎng)景;二是后期驗(yàn)證和校正機(jī)制;三是使用更復(fù)雜的約束和規(guī)則。

其中,第一點(diǎn)最為關(guān)鍵,即大部分問題都有對(duì)應(yīng)語料進(jìn)行過訓(xùn)練。但對(duì)于沒見過的場(chǎng)景和問題,在沒有對(duì)應(yīng)語料的情況下,大模型編造依然存在。因此,從AI大模型的“養(yǎng)料”——數(shù)據(jù)側(cè)開始規(guī)避幻覺至關(guān)重要。

明略科技認(rèn)為,對(duì)企業(yè)而言,

一方面,在特定行業(yè)場(chǎng)景中,企業(yè)要用事實(shí)性數(shù)據(jù)反AI幻覺,選用權(quán)威數(shù)據(jù)源,有效彌補(bǔ)大模型在專有知識(shí)上的缺失;

另一方面,企業(yè)要加強(qiáng)知識(shí)庫(kù)建設(shè),并充分運(yùn)用檢索增強(qiáng)生成(RAG)技術(shù)。

RAG相當(dāng)于為大模型配備了一個(gè)超級(jí)外掛,用戶可以隨時(shí)從可靠資料中獲取可靠信息,從而獲得更加靠譜的答案。

目前,明略科技在RAG領(lǐng)域引入了多模態(tài)圖表識(shí)別、PDF表格定向增強(qiáng)、文檔路由、指代消解、檢索重排、元數(shù)據(jù)增強(qiáng)等20+技術(shù)在細(xì)節(jié)中打磨產(chǎn)品,提升信息提取、信息召回、知識(shí)問答的準(zhǔn)確率和召回率,進(jìn)而提升了企業(yè)在知識(shí)檢索和問答的體驗(yàn),讓企業(yè)知識(shí)發(fā)揮出更大價(jià)值。

信息填寫

*手機(jī)號(hào)碼:

請(qǐng)選協(xié)議

主站蜘蛛池模板: 国产两女互慰高潮视频在线观看| 大肉大捧一进一出视频| 久久欧美一区二区三区性牲奴| 亚洲成av人片在线观看| 国产午夜影视大全免费观看| 国产成人无码精品亚洲| 国产露脸150部国语对白| 国产一区二区三区怡红院| 国产 亚洲 中文在线 字幕| 国产主播av福利精品一区| 国产午夜片无码区在线观看| 天天躁日日躁狠狠躁av麻豆男男 | 日本工口里番无遮█彩色| 天天摸夜夜添夜夜无码| 狠狠亚洲超碰狼人久久| 亚洲中文字幕无码永久免弗| 国产大屁股视频免费区| 亚洲欧美国产另类视频| 日韩人妻无码精品专区综合网| 天天躁日日躁狠狠躁欧美老妇小说| 日本一区二区三区专线| 亚洲欧洲av综合一区二区三区| 午夜理论无码片在线观看免费| 精品无码午夜福利电影片 | 男女一边摸一边做爽爽的免费阅读| 亚洲精品~无码抽插| 久久成人网站亚洲综合| 无码中文字幕热热久久| 中文字幕日韩精品亚洲七区| 国产美女精品视频线播放| 爆乳护士一区二区三区在线播放| 亚洲a成人无m网站在线| 国产乱子伦60女人的皮视频| 丰满人妻熟妇乱又伦精品软件 | 国产成a人亚洲精v品久久网 | 色悠久久久久综合网国产| 国产人妻人伦精品1国产盗摄| 无码人妻h动漫中文字幕| 国产乱码卡一卡2卡三卡四| 伊人久久大香线蕉av色婷婷色| 在线观看特色大片免费网站|