IT之家 10 月 10 日消息,科技媒體 decrypt 今天(10 月 10 日)發布博文,報道稱 OpenAI 發布研究報告,稱 GPT-5 是該公司迄今“偏見最少”的 AI 模型,在處理政治敏感內容時,表現出更強的中立性。
測(ce)試數(shu)據顯示,新(xin)推出的 GPT-5 Instant 和 GPT-5 Thinking 模型,其可衡量的政(zheng)治(zhi)偏(pian)見程度相較于 GPT-4o 等早期版(ban)本降(jiang)低了 30%,尤(you)其在(zai)應(ying)對具(ju)有爭議性或黨派色彩(cai)的話(hua)題時效(xiao)果顯著。
IT之家注:政治偏見(Political Bias)是指 AI 模型(xing)在處理(li)涉及政治、意識形態或(huo)社(she)會爭議性話題時,其回答(da)沒有保持客觀(guan)中(zhong)立,不(bu)知(zhi)不(bu)覺地傾向于某一方的觀(guan)點、黨(dang)派或(huo)立場。
這項(xiang)研究由 OpenAI 內部(bu)的“模(mo)型(xing)行為(wei)”部(bu)門主導,該(gai)團隊由 Joanne Jang 領導,專(zhuan)注(zhu)于研究用戶提示詞(ci)與模(mo)型(xing)對齊如何共同塑造(zao) AI 的響應(ying)。




團隊的核(he)心目(mu)標是建立(li)一套科學的評估框架,將“偏見”這(zhe)一主觀(guan)且復雜的概念,轉化(hua)為(wei)可量化(hua)、可追蹤(zong)的性能指標,從而指導后續模型(xing)的迭代與(yu)優化(hua),確保(bao) AI 系統在推理和語調上更加(jia)平衡。
為(wei)確保(bao)評估的全(quan)面性,研究團隊設(she)計了 500 個獨特(te)的提示詞,內容(rong)覆蓋從立(li)場中立(li)到情緒激烈的各類政(zheng)治問題(ti),以(yi)真實(shi)模擬用戶在現實(shi)世界(jie)中的提問方式(shi)。



研究員 Natalie Staudacher 表示,即使在刻意(yi)誘導模型(xing)產生偏(pian)頗或(huo)情緒(xu)化語言(yan)的壓力測(ce)試下,政治偏(pian)見也(ye)僅“罕見且輕微地”出現。
廣(guang)告(gao)聲明:文內(nei)含有(you)的對外跳(tiao)轉鏈接(jie)(包括不限于超(chao)鏈接(jie)、二(er)維碼、口令等形式),用于傳遞更(geng)多信息,節省甄選時間,結(jie)果僅(jin)供參(can)考,IT之家所有(you)文章均包含本聲明。