亚洲一线二线三线久久久_亚洲一区和二区_欧美一级一片_中文字幕日本在线_www.99视频_亚洲成年人在线播放_91国内揄拍国内精品对白_91亚洲精品久久久蜜桃网站_极品人妻一区二区_99视频精品

加入收藏夾 設置首頁
當前位置:首頁 >科教
你被 AI 騙過嗎?新研究:一個方法能對 AI “測謊”
來源:科普中國 2024-12-24 17:10:35
評論

胡說八道不可怕,一本正經的胡說八道才可怕,你因為一本正經而信了ta的胡說八道,更可怕……這就是當下我們(捏著鼻子)使用 AI 時需要面對的現狀。

如何避免 AI 生成虛假的事實內容,對使用者產生誤導呢?各個大模型平臺一直在研究和嘗試,而要想“避免”問題,首先得“識別”問題。6 月 19 日,牛津大學一個研究團隊發表在《自然》雜志上的一項新研究,提出了一種頗有潛力的給AI“測謊”的方法,下面咱們就詳細聊聊。

大模型的胡說八道和風險

“幻覺”(Hallucinations)是大語言模型(例如 ChatGPT、Gemini、或文心一言)面臨的一個關鍵問題,也是網絡上常見的用戶體驗吐槽類型之一,這個術語可以粗略地理解為 AI 一本正經的胡說八道。

比如,你問 ChatGPT:恐龍扛狼是什么意思?

它會一本正經地告訴你——這象征著舊勢力和新力量的對抗,是弱小但機智靈活的挑戰者和強大卻缺乏靈活的對手之間的博弈。

答案非常洗滌靈魂,上升到哲理和價值觀高度,但是,它在胡說八道。

圖片

這只是大語言模型常見的“幻覺”類型之一,其他類型還包括:

1、錯誤的歷史事實

“誰是美國的第一位總統?” ChatGPT 回答:“托馬斯·杰斐遜。”

2、錯誤的科學信息

“水的沸點是多少?” ChatGPT 回答:“水在標準大氣壓下的沸點是 120 攝氏度?!?/p>

3、編造引用,AI 縫合怪

“愛因斯坦在相對論中說了什么?” ChatGPT 回答:“愛因斯坦曾在《相對論與現實》一書中說過,‘時間是一種幻覺’?!彪m然愛因斯坦的確討論過時間的相對性,但他并沒有在所謂的《相對論與現實》一書中發表這句話。實際上,這本書可能根本不存在。這是模型編造的引用。

4、誤導性的健康、法務、財務建議

你問:“感冒了應該吃什么藥?” ChatGPT 回答:“感冒了應該吃抗生素。”

除了上述問題,相信大家在使用 AI 的過程中也會碰到其他胡說八道的情況。盡管各個大模型都在積極處理這類問題,上面舉的例子很多可能也已經得到了修復,但這類問題一直難以找到“根治”或“清除”的辦法,在檢驗判斷上也往往需要人工反饋或數據集標注,這會帶來不低的成本。

這讓我們使用 AI 的體驗大打折扣——誰敢毫無保留地信任一個滿嘴跑火車的助手呢?何況有些問題事關健康和安全,弄錯可是要出大事的。

有沒有什么辦法,能更通用化地“計算”出 AI 到底有沒有瞎說呢?

“語義熵”如何幫助大模型檢測謊言?

日前(6 月 19 日),牛津大學團隊在《自然》(Nature)雜志發表了一篇論文,提出了一種新的分析和計算方法,為解決大語言模型“幻覺”問題,打開了新思路。

圖片

圖源:《自然》(Nature)官網,中文翻譯來自瀏覽器插件“沉浸式翻譯”

團隊提出了一種基于統計學的熵估計方法,稱為“語義熵”,來檢測大語言模型中的“編造”(confabulation),即大模型飽受詬病的“胡言亂語癥”。作者在多個數據集上測試了語義熵方法,結果顯示語義熵方法在檢測編造方面顯著優于其他基準方法。

那么“語義熵”究竟是什么呢?

拋開冗長的專業解釋,我們可以將語義熵簡單理解為概率統計的一種指標,用來測量一段答案中的信息是否一致。如果熵值較低,即大家都給出類似的答案,說明信息可信。但如果熵值較高,答案各不相同,說明信息可能有問題。

這有點類似于,如果一個人在撒謊,他可能沒辦法每次把謊言的細節編造得一模一樣。一個謊言往往需要無數個謊言來幫它扯圓。從信息論的角度來看,可能會引入更多的不確定性和隨機性。說謊者需要引入額外的信息或細節來支持其不真實的敘述,這可能會增加信息的不確定性或熵值,進而被算法檢測出來。

比如,當你問 AI“世界上最高的山是哪座?”

大模型可能會給出幾個答案:“珠穆朗瑪峰”“乞力馬扎羅山”“安第斯山脈”。

通過計算這些答案的語義熵,發現“珠穆朗瑪峰”這個答案出現頻率最高,其他答案則很少甚至沒有出現。低語義熵值表明“珠穆朗瑪峰”是可信的答案。

語義熵,既有優勢,也有弱點

語義熵檢測方法的優勢在于不需要任何先驗知識,無需額外的監督或強化學習通俗地講,使用這種方法時,并不需要上知天文下知地理,只需要遇事不決看看大家都怎么說。

而目前常用的諸如標注數據、對抗性訓練等方法,“泛化”效果(即舉一反三的能力),都不如通過語義熵計算。即便是大模型從未遇到過的新語義場景,也能適用語義熵方法。

當然,語義熵雖然是一種相對有效的辦法,但不是萬靈藥,它自己也有一定局限性:

1、處理模糊和復雜問題的能力有限

語義熵在處理非常模糊或復雜的問題時可能不夠有效。

在面對多種可能正確答案的問題時,比如“最好的編程語言是什么?”,語義熵可能無法明確區分哪一個答案更可靠,因為多個答案都可能是合理的。

(誰說是 Python?我 C++第一個不服?。。?/p>

2、忽略上下文和常識

語義熵主要基于統計和概率計算,可能忽略了上下文和常識的影響。在一些需要綜合上下文和常識來判斷的問題中,語義熵可能無法提供準確的可靠性評估。比如經常談戀愛的朋友可能有體會,情侶間一句話:“我沒事兒,你忙吧?!?/p>

你覺得 TA 是真沒事兒,還是有很大事兒?

在這種情況下,得結合上下文場景、人物狀態等信息判斷,不同的上下文會導致不同的理解。語義熵只能基于詞語的統計概率進行評估,可能會給出錯誤的判斷。

再比如常識性的判斷,既物理世界的客觀規律,假設我們問一個問題:“太陽從哪邊升起?”

正確答案是“東邊”。然而,如果我們有以下兩個候選答案:

1.太陽從東邊升起。

2.太陽從西邊升起。

(這可能由于模型訓練數據的偏差和生成過程的隨機性導致)

即使語義熵檢測到兩個答案的概率分布接近,但常識告訴我們答案 1 才是正確的。語義熵在這種情況下可能無法提供足夠的信息來判斷答案的可靠性。

3、如果訓練數據被無意或刻意“污染”,語義熵也沒辦法很好識別

如果用錯誤的數據,給大模型施加了“思想鋼印”,模型對其生成的錯誤陳述非常“自信”(即錯誤陳述在模型的輸出概率分布中占主導地位),那么這些陳述的熵值可能并不會很高。

最后總結一下,從大模型的內容生成機制上看,“幻覺”問題沒辦法 100%避免。當我們在使用AI生成的內容時,重要的數理推理、歷史事件或科學結論、法律和健康知識等方面最好進行人工核查。

不過,換個角度,“幻覺”也是大語言模型的創造力體現,我們也許應該善用大模型的“幻覺”能力。畢竟幻覺不一定是 bug(故障),而是大模型的 feature(特點)。

如果需要檢索事實,我們已經有了搜索引擎工具。但如果需要有人幫我們編輯一個“恐龍扛狼”的無厘頭劇本,那么,大語言模型顯然是個更好的助手。

圖片


比如筆者費盡心思想畫一幅恐龍扛狼圖,但某 AI 油鹽不進,畫出了一幅恐龍把狼吞了(疑似)的圖,難怪理解不了恐龍扛狼的真意啊……

參考文獻

[1] S. Farquhar, J. Kossen, L. Kuhn, and Y. Gal, “Detecting hallucinations in large language models using semantic entropy,” Nature, vol. 630, no. 8017, pp. 625–630, 2024, doi: 10.1038/s41586-024-07421-0.

作者:木木

編輯:梁正城

記者:

評論

文明上網 理性發言

登錄
全部評論 0條評論
加載中...

請先登錄

取消
確定
欧美成人性生活视频| 三级网站视频在在线播放| 欧美精品成人在线| 91精品婷婷国产综合久久蝌蚪| 成人av在线资源| 91视频你懂的| 国产三区在线观看| 国产老头和老头xxxx×| 日本一二三视频| 国产成人午夜| 韩国一区二区视频| 亚洲黄色录像| 人妻无码一区二区三区| 日韩国产中文字幕| 日本午夜精品一区二区三区电影| 最爽无遮挡行房视频在线| 精品无码三级在线观看视频| 乱子伦视频在线看| 真实原创一区二区影院| 中文字幕欧美精品在线| 久久精品国产亚洲一区二区三区| 亚洲精品国产a| 丰满少妇久久久| 性欧美丰满熟妇xxxx性久久久| 国产精品嫩草影院com| 亚洲天堂网av在线| 日韩电影中文字幕一区| 99亚洲伊人久久精品影院红桃| 精品一区久久久| 日韩精品一区二区三区在线| 蜜桃91麻豆精品一二三区| 国产主播在线资源| 丁香久久综合| 99精品视频在线观看免费| 欧美三级在线播放| 免费男女羞羞的视频网站中文子暮| 国产9色视频| 日本r级电影在线观看| 蜜桃国内精品久久久久软件9| 不卡av在线网| 国产精品69xx| 日本一区二区三区dvd视频在线| 亚洲精品成人在线视频| 亚洲免费在线观看av| 欧美a一级片| 国产乡下妇女做爰| 激情成人中文字幕| 欧美视频第一区| 国产精品91久久| 久久久久久久久久久久| 91传媒免费视频| 麻豆国产va免费精品高清在线| 亚洲天天影视| 亚洲伦理在线观看| wwwwww国产| 丰满少妇久久久久久久| 欧美成人vr18sexvr| 亚洲永久免费视频| 色婷婷精品久久二区二区蜜臂av| 女~淫辱の触手3d动漫| 日韩欧美视频免费在线观看| 久久一日本道色综合| 美女视频免费观看网站在线| 成 人免费视频播放| 日韩精品在线观| 精品视频免费在线观看| 亚洲欧美成人综合| 久久精彩视频| 国产一区香蕉久久| 中文字幕字幕中文在线中不卡视频| 手机看片福利永久| 性欧美1819| 国产女人被狂躁到高潮小说| 成人性生交大片免费看视频直播| 国产成人精品三级高清久久91| 亚洲人一区二区| 小小女视频网站色琼网站| 懂色av一区二区三区在线播放| 久久综合加勒比| 久久久精品视频成人| 欧美13~18sex性hd| 国产自偷自偷免费一区| 成人一区福利| 成年人免费网站在线观看| 国产色播av在线| 成都免费高清电影| 欧美一区国产一区| 日韩亚洲不卡在线| 1级黄色大片儿| 天堂av2024| 国产女人水真多18毛片18精品视频| 中文字幕资源在线观看| 1024手机看片国产| 欧美激情一区二区三区在线| 浴室偷拍美女洗澡456在线| av电影院在线看| www精品国产| 中文av一区二区三区| 成人免费淫片视频软件| 国产裸舞福利在线视频合集| 黄色大秀av大片| 污污网站免费看| 日韩欧美一中文字暮专区| 久久91av| 欧美1819sex性处18免费| 亚洲第一中文字幕| 欧美日韩亚洲一二三| 日韩亚洲综合在线| 伊人五月天婷婷| 最近中文字幕mv免费高清视频8| 性感美女福利视频| 精品五月天堂| 午夜精品毛片| 亚洲无吗在线| 麻豆传媒在线完整视频| 91视频综合网| 日韩成人dvd| 精品少妇人妻av免费久久洗澡| 亚洲男人都懂第一日本| 久久亚洲美女| 国模大尺度私拍在线视频| 日韩黄色在线观看| 国产资源在线观看入口av| 污黄视频在线观看| 韩国中文免费在线视频| 丝袜美女写真福利视频| 日本免费不卡一区二区| 亚洲国产成人一区二区三区| 免费在线播放第一区高清av| 国产日韩欧美精品一区二区三区| 又黄又爽又色的视频| 清清草免费视频| 欧美v国产在线一区二区三区| 黄色小视频在线播放| 免费观看国产精品视频| 国产一区二区三区站长工具| 99精品女人在线观看免费视频| 极品美女销魂一区二区三区| 亚洲女人被黑人巨大进入| 亚洲综合中文| 亚洲精品午夜精品| 欧美精美视频| 91日韩一区二区三区| 国产成人av在线| 亚洲免费黄色网址| 99青草视频在线播放视| 中国大陆高清aⅴ毛片| 精品一卡二卡三卡四卡日本乱码| 精品国产亚洲一区二区三区在线观看| 日韩精品一区二区亚洲av性色| 欧美亚洲福利| 98精品国产自产在线观看| 亚洲午夜精品在线观看| 在线免费观看毛片| 国产福利91精品一区二区三区| 精品久久久久久亚洲| 久久婷婷综合激情| 最新亚洲精品| 欧美手机在线观看| 波多野结衣网页| 天堂精品视频| 国产精品中文字幕亚洲欧美| 国产精品99久久久久久动医院| 91sp网站在线观看入口| 狂野欧美性猛交xxxx巴西| 中文字幕乱码亚洲无线精品一区| 在线一级成人| 天堂美国久久| 极品白嫩的小少妇| 欧美视频综合| 亚洲一区三区在线观看| 99超碰麻豆| 五月婷婷丁香激情| 91精品啪在线观看国产18| 日韩激情一二三区| 综合激情成人伊人| 日本一欧美一欧美一亚洲视频| 免费黄色网网址| 亚洲三级免费电影| 一区二区三区成人| 中文字幕亚洲无线码在线一区| 亚洲精品视频在线观看免费视频| 黄色的视频在线观看| 国产片一区二区| 香蕉久久aⅴ一区二区三区| 亚州av中文字幕在线免费观看| 欧美极度另类| 天堂日韩电影| 成人综合社区| 亚洲涩涩在线观看| 91精品国产综合久久久蜜臀图片| 久久天堂av综合合色| 亚洲人成五月天| 2019一级黄色毛片免费看网| 国产精品视频一区二区三区不卡| 日本精品www| 国产精品自产拍在线观看中文| www.色综合.com| 网站免费满18成年在线观看| 在线成人福利| 亚洲日韩欧美一区二区在线| 久久国产精品免费| 99久久精品久久久久久ai换脸| 日韩欧美看国产| 天天综合色天天综合色hd| av成人资源| 日韩综合在线观看| 日本一区二区三区电影免费观看| 1000部国产精品成人观看| 国产无套粉嫩白浆在线2022年| 日韩在线视频免费观看| 国产偷国产偷精品高清尤物| 免费av播放| 亚洲国产精彩视频| 亚洲第一精品电影| 丁香花免费高清完整在线播放| 国产精品青草久久久久福利99| 欧美一区二区播放| 国产mv日韩mv欧美| 国产精品对白交换视频| 尤物九九久久国产精品的分类| 国产一级又黄| 国产99久一区二区三区a片| 国产精品一区二区av日韩在线| 狠狠综合久久av一区二区| 日韩av电影在线观看| 日本一区二区在线免费播放| 高清视频国产| 国v精品久久久网| 网曝91综合精品门事件在线| 日韩一级特黄| 亚洲一级片在线播放| 一区二区视频免费完整版观看| 性欧美大胆高清视频| 国产私拍一区| 四虎免费视频| www.五月婷婷| 黄色片免费在线观看视频| 天天色天天爱天天射综合| 国产啪精品视频网站| 依依成人在线| av在线天天| 国内精品露脸在线视频播放| 国产精品久久精品日日| 亚洲美女在线播放| 午夜精品久久久久久久99热影院| 99re6在线视频| 成人免费在线观看网站| 日韩精品电影一区亚洲| 搞黄视频在线观看| 欧美电影完整版在线观看| 中文字幕av网站| 亚洲精品无播放器在线播放| 欧美婷婷久久五月精品三区| 亚洲色图综合区| 亚洲精品一区二区口爆| 日韩电影中文字幕av| 日韩美女一级片| 亚洲高清电影| 韩国三级在线一区| 97在线超碰| 国产日本欧美在线| 亚洲成人1区2区| 久久午夜色播影院免费高清| jizz免费视频| 欧美成人精品福利| 五月婷婷六月色| 日本欧美爱爱爱| 久久久亚洲国产天美传媒修理工| 亚洲第一精品在线观看| 日韩高清人体午夜| 五月婷婷在线观看视频| 日韩欧美中文字幕公布| 国产精品在线看| 蜜臀久久久99精品久久久久久| 国产成人精品无码片区在线| 成年人深夜福利| 国产一区二区三区久久悠悠色av| 一级黄色短视频| 日韩欧美一中文字暮专区| 精品国产无码一区二区| 日韩动漫在线观看| 久久久久亚洲精品| 超碰在线公开97| 成人高清在线观看免费| 国产91xxx| 欧美国产日韩一二三区| 桥本有菜av在线| 一级黄色片在线免费观看| 男人日女人网站| 在线观看区一区二| 亚洲美女av电影| 国产精品久久久久久久久久久久冷| 日韩欧美国产一二三区| 99久久精品一区二区| 天天干天天操天天爱| 26uuu国产电影一区二区| 欧美 日本 亚洲| 一区二区三区四区五区视频| 丝袜av一区| 欧美一区成人| 国产午夜麻豆影院在线观看| 国产精品久久久久影院| 国产欧美日韩专区发布| 国产精品理伦片| 91在线视频观看| 国产午夜久久久久| 人人妻人人玩人人澡人人爽| 免费观看的成年网址| 欧美日韩精品不卡| 免费无码毛片一区二区app| 自拍网站在线观看| 拍拍拍在线观看视频免费| 高清成人在线| 玖玖玖精品中文字幕| 经典三级一区二区三区视频| 超碰在线超碰在线| 2018亚洲男人天堂| 国产精品免费视频观看| 欧美视频一区二区在线| 二区三区不卡不卡视频| 久草在线资源福利| av亚洲男人天堂| 欧美二区在线看| 欧美日韩免费观看视频| 很黄很色的网站| www红色一片_亚洲成a人片在线观看_| 粉嫩av一区二区夜夜嗨|