去年OpenAI開啟生成式人工智能浪潮,由大模型帶動的AI產(chǎn)業(yè)一路狂奔。行業(yè)快速發(fā)展過程中,如何讓它的行為跟人類的價值真實意圖、倫理原則相一致,這成為學(xué)術(shù)、政策、產(chǎn)業(yè)等領(lǐng)域多方關(guān)注的“價值對齊”問題。

10月26日,由騰訊研究院華東基地、騰訊優(yōu)圖實驗室主辦的第一期“智創(chuàng)滬聯(lián)”活動,在上海諾布中心正式舉辦?;顒右浴按竽P蛢r值對齊”為主題進行研討,深入探尋價值對齊問題的創(chuàng)新性解決方案與法律倫理治理,確保AI技術(shù)符合社會預(yù)期,探索AI與人類價值間的平衡。多位來自AI領(lǐng)域前沿的學(xué)者、專家分享自己看法和研究成果。

圖形用戶界面 描述已自動生成

上海市人工智能行業(yè)協(xié)會秘書長鐘俊浩在致辭中指出,在行業(yè)發(fā)展過程中,大模型的“價值對齊”作為一種推動各領(lǐng)域協(xié)同發(fā)展的有效手段,具有重要的現(xiàn)實意義和深遠(yuǎn)的影響,還將為全球合作與發(fā)展提供新的契機。

上海交通大學(xué)副教授劉鵬飛指出,包括Open?AI在內(nèi)的大部分人工智能推動組織,都在積極運用各種方案加強價值對齊的完善落地,諸如監(jiān)督精調(diào)、基于人類反饋的強化學(xué)習(xí)、基于檢索的事實對齊,以及嘗試使用工具對模型進行對齊,都是現(xiàn)階段被行業(yè)寄予厚望的“AI價值對齊”可執(zhí)行方案。

電腦前的人們 描述已自動生成

人機合作走向現(xiàn)實,AI價值對齊不可或缺

如何避免數(shù)據(jù)規(guī)模與算力不斷提升的AI大模型遭到濫用、生產(chǎn)有害內(nèi)容,已經(jīng)是人工智能行業(yè)的核心議題之一。正因如此,能夠有效增強AI大模型安全與實用性的“AI價值對齊”,才會成為行業(yè)關(guān)注的焦點。

騰訊研究院秘書長張欽坤指出,價值對齊將成為AI產(chǎn)品的重要競爭力。因為,大模型價值對齊的實現(xiàn),需要對齊技術(shù)(人類反饋強化學(xué)習(xí)、AI監(jiān)督等)、訓(xùn)練數(shù)據(jù)干預(yù)、模型可解釋、對抗測試等多種技術(shù)和治理措施的結(jié)合,同時未來還需要著重考慮如何通過更多的社會參與來形成價值對齊的共識,以及如何使監(jiān)督、理解、設(shè)計AI模型的能力與模型本身的復(fù)雜性同步發(fā)展,以更好地對大模型進行有效的監(jiān)督。

“我們期待的是大語言模型可以和人類的價值、真實的意圖相一致,確保AI技術(shù)可以可靠和安全地服務(wù)于人,并且確保社會經(jīng)濟可以健康地增長。”上海交通大學(xué)劉鵬飛副教授介紹道。

劉鵬飛教授表示,隨著生成式人工智能實用性不斷增長,除了最基礎(chǔ)的性能優(yōu)化之外,價值對齊的重要性,也隨著AI大模型的快速迭代迅速提升。缺乏對齊的大模型不僅會生成大量虛假甚至有害的信息,在高階應(yīng)用領(lǐng)域更會產(chǎn)生巨大的危險隱患。

上海交通大學(xué)的閆宏秀教授則表示,技術(shù)的發(fā)展進步,始終遵循著消除風(fēng)險、力求確定性的趨勢,作為應(yīng)對風(fēng)險的有效方式,“信任”始終是人類的必選項。沒有信任,技術(shù)發(fā)展的停滯幾乎是必然的。讓人工智能走向可信、可控、可靠,讓人機合作走向現(xiàn)實,“AI價值對齊”正是其中不可或缺的一環(huán)。

“以合乎倫理的結(jié)構(gòu)性性能來夯實價值對齊的底層倫理邏輯,以對信任的理性認(rèn)知構(gòu)建價值對齊的邊界?!遍Z宏秀教授總結(jié)道。

讓AI價值對齊落地,多國用立法進行詮釋

多位嘉賓在論壇活動上表示,明確了技術(shù)路徑,如何將技術(shù)理論結(jié)合實際需求盡快落地,無疑是現(xiàn)階段“AI價值對齊”議題的發(fā)展重點。

來自上海人工智能實驗室治理研究中心的研究員滕妍指出,想要加速“AI價值對齊”的發(fā)展,除了“基于人類反饋進行調(diào)整”之外,讓人工智能部分監(jiān)督,或者協(xié)調(diào)人類技術(shù)進行監(jiān)督,提供一些高質(zhì)量的反饋數(shù)據(jù)來提高價值對齊能力,是目前各國熱度很高的研究方向之一,包括OpenAI在內(nèi)都對這個領(lǐng)域投入過不少關(guān)注。

“除此之外,在‘確認(rèn)大模型是否對齊’的評估環(huán)節(jié),除了采用人工手段進行驗證之外,通過專用的AI模型來進行評測,同樣逐漸成為行業(yè)的趨勢所在?!彪J(rèn)為,從準(zhǔn)確率來看,評測模型依舊有提升空間,但從執(zhí)行與迭代的效率來看,利用AI大模型來加速人工智能價值對齊,前景十分可觀。

除了技術(shù)與倫理層面,在攸關(guān)社會現(xiàn)實運轉(zhuǎn)的法律層面,“AI價值對齊”同樣帶來了全新的挑戰(zhàn),對此,來自同濟大學(xué)法學(xué)院的助理教授朱悅,分享了最新的行業(yè)觀點:

“從國內(nèi)的《生成式人工智能信息安全服務(wù)規(guī)定》,到歐盟的《人工智能法案》,再到美國頭部企業(yè)的深度自治試驗,在全球范圍內(nèi),積極推動AI大模型技術(shù)發(fā)展的國家和地區(qū),都將相關(guān)法令研討提上了日程。而透明、可解釋和可問責(zé)以及個人層面的隱私保護等詳盡問題,都是現(xiàn)如今在立法過程中遇到的挑戰(zhàn)。”

朱悅指出,雖然在目前這個“AI價值對齊”依舊處于基礎(chǔ)技術(shù)迭代的早期階段,在法律層面上做出定論為時尚早,但從各國政府和跨國企業(yè)的積極性來看,通過立法對“AI價值對齊”進行詮釋,并通過實踐來不斷完善,已經(jīng)是行業(yè)的大勢所趨。

圍繞AI對齊的方法論、監(jiān)管實施等話題,來自上海復(fù)旦大學(xué)計算機系的肖仰華教授、上海交通大學(xué)的張拳石副教授、對外經(jīng)濟貿(mào)易大學(xué)法學(xué)院的許可副教授、安遠(yuǎn)AI資深研究經(jīng)理方亮、螞蟻集團全面風(fēng)險管理部專家王炳浩,以及騰訊優(yōu)圖實驗室的高級研究員李珂、騰訊研究院高級研究員曹建峰,通過圓桌討論深入交換了觀點見解,從不同角度出發(fā),剖析并肯定了“AI價值對齊”對人工智能行業(yè)發(fā)展的重要意義。

會議室里的人們 描述已自動生成

關(guān)注AI價值對齊 科技向善再進一步

AI價值對齊,是當(dāng)前階段人工智能領(lǐng)域最具挑戰(zhàn)性的基礎(chǔ)研究項目之一,需要廣泛的學(xué)科和社會參與,其研究價值,更是攸關(guān)下一階段更強大的AI能否得以安全控制,實現(xiàn)AI向善的長遠(yuǎn)目標(biāo)。AI價值對齊所蘊含的倫理道德意義,也是與主辦方騰訊研究院一貫堅持的“科技向善”理念吻合。

根據(jù)騰訊研究院華東基地秘書長徐思彥介紹,騰訊研究院作為騰訊公司設(shè)立的智庫機構(gòu),在上海設(shè)立了華東基地作為區(qū)域研究的交流平臺,聯(lián)合本地產(chǎn)學(xué)研各類機構(gòu),通過對話沙龍、課題研究和白皮書等方式,開展前沿科技、人工智能、未來城市、金融科技、工業(yè)互聯(lián)網(wǎng)等多領(lǐng)域的研究。

作為騰訊研究院華東基地打造的城市品牌系列活動,“智創(chuàng)滬聯(lián)”論壇將定期邀請業(yè)界專家,探討在科技創(chuàng)新不斷的發(fā)展過程中,前沿科技的演變可能帶來的商業(yè)模式的變化以及涉及的相關(guān)政策和法律問題。

作為第一期的“大模型價值對齊”研討活動,得到了上海市人工智能行業(yè)協(xié)會、上海市數(shù)據(jù)科學(xué)重點實驗室、上海人工智能實驗室治理研究中心,以及對外經(jīng)濟貿(mào)易大學(xué)數(shù)字經(jīng)濟與法律創(chuàng)新研究中心協(xié)辦支持。