飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

揭秘OpenAI“紅軍”:聘請專家攻擊ChatGPT 解決技術倫理問題

2023年4月17日 09:05  新浪科技  

北京時間4月17日早間消息,據報道,在安德魯·懷特(Andrew White)獲得GPT-4的使用權之后,他使用這一人工智能系統提出了一種全新的神經毒劑。GPT-4是熱門聊天機器人(11.890, 0.00, 0.00%)ChatGPT背后的人工智能技術。

作為羅切斯特大學的化學工程教授,懷特是OpenAI去年聘請的50名專家學者之一。在6個月的時間里,這支“紅軍”對這一新模型進行了“定性探索和對抗性測試”,試圖攻擊它。

懷特表示,他使用GPT-4的建議生成了一種可作為化學武器的化合物,并使用“插件”為這個模型提供新的信息源,例如學術論文和化學品制造商名錄。隨后,這個聊天機器人找到了一個地方來制造這種化合物。

他說:“我認為,這將使每個人都獲得更快速、更準確地工具去從事化工行業。但這也使得人們會以更危險的方式去開展化學活動,帶來了很大的風險。”

上個月,OpenAI面向更廣泛的公眾發布了這項新技術,而這些令人驚訝的發現確保新技術不會帶來不良后果。

事實上,“紅軍”的演習目的是探索并了解在社會上部署先進人工智能系統會造成什么樣的風險,解決公眾這方面的擔憂。他們在工作中提出探索性的或是危險的問題,以測試這個工具在回答問題時的詳細程度。

OpenAI想要探索模型毒性、偏見和歧視等問題。因此,“紅軍”就謊言、語言操縱和危險的科學常識進行了測試。他們還評估了模型協助和教唆剽竊的情況、金融犯罪和信息安全攻擊等違法活動的可能性,以及模型可能會如何威脅國家安全和戰場通信。

“紅軍”由一系列專業人士組成,包括學者、教師、律師、風險分析師和信息安全研究員,主要來自美國和歐洲。他們的發現被反饋給OpenAI。在更廣泛地推出GPT-4之前,“紅軍”提供的意見被用于模型的重新訓練,解決GPT-4的問題。在幾個月的時間里,專家們每人花了10到40個小時去測試這個模型。多名受訪者表示,他們的工作時薪約為100美元。

其中的許多人都對語言模型的快速發展提出了擔憂,尤其是通過插件將語言模型與外部知識源連接在一起可能造成的風險。

GPT-4“紅軍”的成員、瓦倫西亞人工智能研究所教授何塞·埃爾南德斯-奧拉洛(José Hernández-Orallo)表示:“今天,系統被凍結了。這意味著它不再學習,也不再有記憶。但如果我們讓系統繼續有機會訪問互聯網,那么會怎樣?這可能會成為一個與世界相連的非常強大的系統。”

OpenAI表示,該公司認真對待安全性問題,并在發布前對插件進行了測試,并將隨著用戶越來越多繼續定期更新GPT-4。

技術研究員羅亞·帕克扎德(Roya Pakzad)使用英語和波斯語的輸入信息對該模型進行了性別、種族和宗教偏見的測試,例如對于佩戴頭巾問題。

帕克扎德承認,這個工具對非英語母語人士能帶來幫助,但也顯示出對邊緣人群的公開刻板印象,即使隨后更新的版本也是如此。她還發現,在用波斯語測試該模型時,聊天機器人用捏造的信息做出回復,即出現所謂“幻覺”的情況更糟糕。與英語相比,在波斯語回復中捏造名字、數字和事件的比例更高。

她表示:“我擔心,語言多樣性和語言背后的文化會受到損害。”

來自內羅畢的律師、唯一一名非洲測試人員博魯·戈洛(Boru Gollo)也注意到了模型的歧視性語氣。他說:“有一次,我在測試這個模型時,它表現得像個白人在跟我說話。在問到某個特定群體時,它會給一個有偏見的意見,或是在回答中出現歧視。”OpenAI承認,GPT-4仍有可能表現出偏見。

“紅軍”的成員還從國家安全的角度對模型進行了評估,但他們對于新模型的安全性有著不同的看法。美國外交關系委員會研究員勞倫·卡恩(Lauren Kahn)表示,當她開始研究,如何將這項技術用于對軍事系統的攻擊時,她“沒有想到模型的回答會如此詳細,以至于我只需要做一些微調即可”。

不過,卡恩和其他信息安全測試者發現,隨著測試時間推移,模型回答的內容逐漸變得安全。OpenAI表示,在推出GPT-4之前,曾訓練過這個模型拒絕回答惡意的信息安全問題。

“紅軍”的許多成員表示,OpenAI在發布GPT-4之前已經進行了嚴格的安全評估。卡內基梅隆大學語言模型毒性專家馬爾滕·薩普(Maarten Sap)說:“他們在消除這些系統中的顯性毒性方面做得非常好。”薩普研究了該模型對不同性別的描述,發現模型的偏見反映的是社會差異。但他也發現,OpenAI做出了一些積極的選擇來對抗偏見。

然而自推出GPT-4以來,OpenAI一直面臨著廣泛的批評。例如,有技術倫理組織向美國聯邦貿易委員會(FTC)投訴,稱GPT-4“有偏見和欺騙性,對隱私和公共安全構成風險”。

最近,該公司推出了一項名為ChatGPT插件的功能。通過該功能,Expedia、OpenTable和Insta等合作伙伴應用可以讓ChatGPT訪問它們的服務,允許ChatGPT代表用戶下單。

“紅軍”的人工智能安全專家丹·亨德里克斯(Dan Hendrycks)表示,這些插件可能會讓人類用戶“脫離整個鏈路”。“如果聊天機器人可以在網上發布你的私人信息,訪問你的銀行賬戶,或者派警察到你家里去,那會怎么樣?總體而言,在讓人工智能掌握互聯網的力量之前,我們需要更有力的安全評估。”

受訪者還警告說,OpenAI不能僅僅因為其軟件是在線的就停止安全測試。喬治城大學安全和新興技術中心的希瑟·弗雷斯(Heather Frase)測試了GPT-4協助犯罪的能力。她表示,隨著越來越多人使用這項技術,風險將繼續擴大。她表示:“你做運行測試的原因是,一旦它們在真實環境中被使用,行為就會不同。”她認為,應該創建一個公共記錄本,報告由大語言模型引發的事故。這類似于信息安全或消費者欺詐報告系統。

勞工經濟學家及研究員薩拉·金斯利(Sara Kingsley)建議,最好的解決方案是清楚地宣傳這方面的危害和風險,“就像食品上的營養標簽”。“關鍵是要形成一個框架,知道經常出現的問題是什么。這樣你就可以有一個安全閥。這也是為什么我認為,這項工作將會永久性的持續下去。”

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 柔软云母板-硬质-水位计云母片组件-首页-武汉长丰云母绝缘材料有限公司 | 整车VOC采样环境舱-甲醛VOC预处理舱-多舱法VOC检测环境仓-上海科绿特科技仪器有限公司 | 温州食堂承包 - 温州市尚膳餐饮管理有限公司| 转子泵_凸轮泵_凸轮转子泵厂家-青岛罗德通用机械设备有限公司 | UV固化机_UVLED光固化机_UV干燥机生产厂家-上海冠顶公司专业生产UV固化机设备 | 沈阳建筑设计公司_加固改造设计_厂房设计_设计资质加盟【金辉设计】 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 茶楼装修设计_茶馆室内设计效果图_云臻轩茶楼装饰公司 | 传爱自考网_传爱自学考试网| 沈阳液压泵_沈阳液压阀_沈阳液压站-沈阳海德太科液压设备有限公司 | 富森高压水枪-柴油驱动-养殖场高压清洗机-山东龙腾环保科技有限公司 | 气弹簧定制-气动杆-可控气弹簧-不锈钢阻尼器-工业气弹簧-可调节气弹簧厂家-常州巨腾气弹簧供应商 | 高压无油空压机_无油水润滑空压机_水润滑无油螺杆空压机_无油空压机厂家-科普柯超滤(广东)节能科技有限公司 | 防火门|抗爆门|超大门|医疗门|隔声门-上海加汇门业生产厂家 | 协议书_协议合同格式模板范本大全 | 湖南档案密集架,智能,物证,移动,价格-湖南档案密集架厂家 | 深圳展厅设计_企业展馆设计_展厅设计公司_数字展厅设计_深圳百艺堂 | 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | 衬氟止回阀_衬氟闸阀_衬氟三通球阀_衬四氟阀门_衬氟阀门厂-浙江利尔多阀门有限公司 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 长江船运_国内海运_内贸船运_大件海运|运输_船舶运输价格_钢材船运_内河运输_风电甲板船_游艇运输_航运货代电话_上海交航船运 | 河南空气能热水器-洛阳空气能采暖-洛阳太阳能热水工程-洛阳润达高科空气能商行 | 网站seo优化_seo云优化_搜索引擎seo_启新网络服务中心 | 水性绝缘漆_凡立水_绝缘漆树脂_环保绝缘漆-深圳维特利环保材料有限公司 | PE一体化污水处理设备_地埋式生活污水净化槽定制厂家-岩康塑业 | 汽车水泵_汽车水泵厂家-瑞安市骏迪汽车配件有限公司 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 韦伯电梯有限公司| 团建-拓展-拓展培训-拓展训练-户外拓展训练基地[无锡劲途] | 智能楼宇-楼宇自控系统-楼宇智能化-楼宇自动化-三水智能化 | 塑料检查井_双扣聚氯乙烯增强管_双壁波纹管-河南中盈塑料制品有限公司 | 武汉不干胶印刷_标签设计印刷_不干胶标签印刷厂 - 武汉不干胶标签印刷厂家 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 武汉森源蓝天环境科技工程有限公司-为环境污染治理提供协同解决方案 | 成都离婚律师|成都结婚律师|成都离婚财产分割律师|成都律师-成都离婚律师网 | 月嫂_保姆_育婴_催乳_母婴护理_产后康复_养老护理-吉祥到家家政 硫酸亚铁-聚合硫酸铁-除氟除磷剂-复合碳源-污水处理药剂厂家—长隆科技 | 液压压力机,液压折弯机,液压剪板机,模锻液压机-鲁南新力机床有限公司 | 真空吸污车_高压清洗车厂家-程力专用汽车股份有限公司官网 | 档案密集架,移动密集架,手摇式密集架,吉林档案密集架-厂家直销★价格公道★质量保证 | 连栋温室大棚建造厂家-智能玻璃温室-薄膜温室_青州市亿诚农业科技 |