nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
黨的二十屆三中全會通過的《中共中央關(guān)于進一步全面深化改革、推進中國式現(xiàn)代化的決定》中明確提出“完善生成式人工智能發(fā)展和管理機制”的任務(wù),并對培育數(shù)據(jù)市場、加強數(shù)據(jù)建設(shè)以及加強網(wǎng)絡(luò)安全體制建設(shè)、建立人工智能安全監(jiān)管制度等問題作了重要闡述。這是黨中央對數(shù)智時代新質(zhì)生產(chǎn)力發(fā)展特征的深刻洞察和清醒判斷,也表明生成式人工智能技術(shù)作為加快發(fā)展新質(zhì)生產(chǎn)力的重要引擎和新一輪國際競爭戰(zhàn)略要地的重要作用不能忽視。
數(shù)據(jù)是生成式人工智能發(fā)展的基礎(chǔ),是決定生成式人工智能的能力和價值觀的核心要素,為塑造國家競爭優(yōu)勢提供了新機遇。2022年6月22日,習(xí)近平總書記主持召開中央全面深化改革委員會第二十六次會議指出,“數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字化、網(wǎng)絡(luò)化、智能化的基礎(chǔ),已快速融入生產(chǎn)分配、流通、消費和社會服務(wù)管理等各個環(huán)節(jié),深刻改變著生產(chǎn)方式、生活方式和社會治理方式”。通過數(shù)據(jù)要素建設(shè)推動生成式人工智能發(fā)展,是培育各行各業(yè)新動能的最優(yōu)路徑。目前,面向人工智能的數(shù)據(jù)治理已在我國政產(chǎn)學(xué)研用界達成普遍共識,但是數(shù)據(jù)治理體系尚未完全建立,治理生態(tài)也未形成氣候,仍處于起步階段。數(shù)據(jù)治理場景復(fù)雜多樣、治理能力整合不足、數(shù)據(jù)安全倫理保護不足、治理工具建設(shè)不足等問題,迫切要求我們以人工智能為切入點對現(xiàn)有治理體系進行重新思考,以建立一個更加適應(yīng)時代需求的數(shù)據(jù)治理新框架,推動構(gòu)建更加安全、負責(zé)、可靠、可信的人工智能系統(tǒng),為滿足人民日益增長的美好生活需要提供優(yōu)質(zhì)高效的智能應(yīng)用服務(wù)。因此,全面理解和分析數(shù)據(jù)治理的現(xiàn)存挑戰(zhàn),并探索最大化數(shù)據(jù)價值的治理方法,實現(xiàn)我國人工智能技術(shù)的高質(zhì)量發(fā)展,是數(shù)字時代研究者亟須探討的重要問題。
第一,培育數(shù)據(jù)治理“四共”觀念,提升多元主體共治合力?!稊?shù)字中國發(fā)展報告(2022年)》顯示,2022年我國數(shù)據(jù)產(chǎn)量達8.1ZB(萬億億字節(jié)),占全球數(shù)據(jù)總產(chǎn)量的10.5%,位居世界第二。據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《Global Data Sphere 2023》預(yù)測,2027年我國數(shù)據(jù)規(guī)模將增長至76.6ZB,位居全球第一。盡管中文數(shù)據(jù)總量大,且增幅可觀,但真正可用于推動生成式人工智能技術(shù)發(fā)展的高質(zhì)量中文數(shù)據(jù)卻相對匱乏。例如,根據(jù)OpenAI公布的訓(xùn)練數(shù)據(jù),GPT-3的英文語料占比高達92.65%,而中文僅占0.1%。從深層來看,這反映了傳統(tǒng)數(shù)據(jù)治理模式在共商、共識、共建、共享方面主體效用發(fā)揮不足,缺乏共治能力。各組織機構(gòu)由于缺乏統(tǒng)一的建設(shè)標(biāo)準和協(xié)商渠道,對優(yōu)質(zhì)數(shù)據(jù)資源的整體分布及其潛在價值未達成普遍共識,往往各自為政建設(shè)語料庫,數(shù)據(jù)割據(jù)和信息孤島現(xiàn)象日益嚴重,不利于數(shù)據(jù)開放共享與流通交易,抑制了數(shù)據(jù)要素“乘數(shù)”效應(yīng),阻礙了其在人工智能領(lǐng)域的價值釋放。
面對這樣的局面,應(yīng)該充分發(fā)揮舉國體制的優(yōu)勢,建立多元主體治理格局,鼓勵企業(yè)、政府等各類組織和個人廣泛參與,推動數(shù)據(jù)治理從政府單一主導(dǎo)向全社會協(xié)同治理的“共商”轉(zhuǎn)變。首先,政府需宏觀掌握國家優(yōu)質(zhì)數(shù)據(jù)資產(chǎn)的分布情況,建立行業(yè)高質(zhì)量數(shù)據(jù)的動態(tài)索引目錄;微觀上應(yīng)引導(dǎo)各主體在數(shù)據(jù)建設(shè)行動指南、數(shù)據(jù)質(zhì)量評價標(biāo)準、數(shù)據(jù)共享開放機制、數(shù)據(jù)安全保護策略、數(shù)據(jù)開發(fā)利用準則等方面達成廣泛“共識”。其次,積極推動建設(shè)國家級數(shù)據(jù)中心,充分發(fā)揮各領(lǐng)域?qū)I(yè)特點,分工協(xié)作,構(gòu)建在自身領(lǐng)域具有專業(yè)優(yōu)勢、對他人領(lǐng)域具有重要補充作用、整體上全面高效的數(shù)據(jù)資源體系,分級分類制定數(shù)據(jù)準入條件,引領(lǐng)數(shù)據(jù)資源平臺建設(shè)和標(biāo)準化工具開發(fā),構(gòu)建優(yōu)勢互補、高效協(xié)作的數(shù)據(jù)資源“共建”模式。最后,政務(wù)數(shù)據(jù)賦能企業(yè)發(fā)展,對激發(fā)行業(yè)高質(zhì)量新動能具有重要價值。應(yīng)促成政務(wù)數(shù)據(jù)開放計劃,鼓勵企業(yè)將派生數(shù)據(jù)反哺回數(shù)據(jù)公共池,實現(xiàn)數(shù)據(jù)資源良性循環(huán)、高效利用,打造具有示范意義的典型案例,激發(fā)市場共享數(shù)據(jù)的能動性,創(chuàng)新數(shù)據(jù)“共享”環(huán)境。通過長期培育共商、共識、共建、共享的“四共”數(shù)據(jù)治理觀念,有效凝聚數(shù)據(jù)治理合力,開創(chuàng)多元主體數(shù)據(jù)“共治”新局面。
第二,構(gòu)建安全風(fēng)險評估體系,平衡大模型安全與發(fā)展。大模型在多個領(lǐng)域展示了強大的應(yīng)用潛力,隨之而來的意識形態(tài)風(fēng)險、數(shù)據(jù)安全等問題更具現(xiàn)實緊迫性。以數(shù)據(jù)為中心的生成式人工智能存在若干典型安全問題,如偏見歧視、隱私泄露、虛假信息、數(shù)據(jù)投毒、立場回避等。面對大模型安全倫理風(fēng)險問題,亟須從科技倫理教育、生成全過程監(jiān)督、智能安全評估、分級分類治理四個方面推動人工智能安全發(fā)展。
其一,現(xiàn)階段大眾在使用過程中普遍欠缺對大模型可能誘發(fā)的風(fēng)險意識,政府需加強對使用者智能技術(shù)的倫理教育和輿論引導(dǎo),強化“以人為本、智能向善”的工具使用觀,提高用戶數(shù)據(jù)治理的使命感、責(zé)任感。其二,高質(zhì)量訓(xùn)練數(shù)據(jù)能有效控制大語言模型安全風(fēng)險。研發(fā)者需構(gòu)建安全評估框架,最大限度實現(xiàn)數(shù)據(jù)來源真實可靠、數(shù)據(jù)采集平衡多樣、數(shù)據(jù)加工透明合規(guī)、數(shù)據(jù)結(jié)果可控可溯、數(shù)據(jù)應(yīng)用公平可信,確保數(shù)據(jù)在訓(xùn)練全過程中受到全面有效的監(jiān)督。其三,在傳統(tǒng)的行為監(jiān)管和審慎監(jiān)管方式外,智能技術(shù)驅(qū)動數(shù)據(jù)治理已成為一種全新途徑。監(jiān)管者應(yīng)從國家層面統(tǒng)一部署大模型應(yīng)用防火墻,構(gòu)建既立足我國價值觀又兼顧國際視野的大模型價值觀對齊框架,形成一套自主的完備動態(tài)敏感詞庫、安全合規(guī)的專業(yè)標(biāo)注語料、典型有效的大模型評測數(shù)據(jù)集,打造可控制、可監(jiān)督、可解釋的人工智能安全評測技術(shù)。其四,過于繁瑣的大模型安全防范法規(guī)或制度會降低大模型創(chuàng)新發(fā)展的速率,數(shù)據(jù)管理者需設(shè)立分類分級敏感數(shù)據(jù)評估框架,允許對不同類型中不同級別的敏感數(shù)據(jù)采取差異化安全管理辦法,在確保高敏感性數(shù)據(jù)得到嚴格保護的同時,給予較低風(fēng)險的數(shù)據(jù)更多開放空間,一定程度上優(yōu)化技術(shù)資源配置,有效平衡安全與發(fā)展。尤其是大模型在數(shù)智時代被視作國之利器,代表的是一個國家和民族的文化自信、價值導(dǎo)向和精神面貌,面對各種立場問題,不能回避疑問,而應(yīng)彰顯中華文化主體精神,向公眾、向世界給出基于現(xiàn)代文明價值觀、契合事物自身是非曲直的正確答案。
第三,優(yōu)化數(shù)據(jù)要素權(quán)責(zé)體系,促進數(shù)據(jù)要素高效流通。數(shù)據(jù)常常是多元主體共同作用的結(jié)果,很少由某個單一主體獨自享有,具有非排他性。公眾、企業(yè)、政府等多方利益主體對數(shù)據(jù)所有權(quán)、控制權(quán)、使用權(quán)、流通權(quán)、收益權(quán)等有不同訴求,多主體權(quán)益糾葛,關(guān)系錯綜復(fù)雜。這包括,個人數(shù)據(jù)的隱私權(quán)與企業(yè)的商業(yè)利用權(quán)之間的矛盾,數(shù)據(jù)創(chuàng)新應(yīng)用與知識產(chǎn)權(quán)保護之間的矛盾,數(shù)據(jù)政治安全和產(chǎn)業(yè)數(shù)據(jù)透明之間的矛盾,智能技術(shù)發(fā)展和規(guī)范技術(shù)邊界之間的矛盾,國家層面的數(shù)據(jù)治理政策與跨國數(shù)據(jù)流動的自由化之間的矛盾,數(shù)據(jù)的創(chuàng)新利用與知識產(chǎn)權(quán)保護之間的矛盾,等等。缺少制度保障時,以上種種沖突難免導(dǎo)致數(shù)據(jù)建設(shè)陷入“大投入,小產(chǎn)出”,甚至零產(chǎn)出的困境,究其原因,是傳統(tǒng)權(quán)利制度框架難以適配數(shù)據(jù)要素的產(chǎn)權(quán)形態(tài)。
2022年12月19日,中共中央、國務(wù)院發(fā)布的《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(即“數(shù)據(jù)二十條”)提出“數(shù)據(jù)資源持有權(quán)、加工使用權(quán)、產(chǎn)品經(jīng)營權(quán)”三權(quán)分置制度框架,為數(shù)據(jù)要素產(chǎn)權(quán)機制體制的確立指明了方向。面對多主體權(quán)益交織的數(shù)據(jù)格局,研究主體應(yīng)以“產(chǎn)權(quán)分置”為探索方向,以“高效流通”為發(fā)展主線,建立一套清晰、高效、可行的多元主體權(quán)屬界定體系和操作行為框架。從確權(quán)角度看,遵循“數(shù)據(jù)二十條”中“淡化所有權(quán)、強調(diào)使用權(quán)”的主張,研究主體有必要充分挖掘數(shù)據(jù)使用需求,全面調(diào)研數(shù)據(jù)交易環(huán)境,在實踐中通盤考慮數(shù)據(jù)開發(fā)過程中各階段數(shù)據(jù)所屬主體,分塊推進各階段數(shù)據(jù)主體的權(quán)益形態(tài),逐步完善各級各類數(shù)據(jù)確權(quán)制度;從授權(quán)角度看,強化公共數(shù)據(jù)在保障安全的前提下以產(chǎn)品形態(tài)提供社會服務(wù),保障企業(yè)數(shù)據(jù)在開發(fā)利用過程中的權(quán)益貢獻,創(chuàng)新授權(quán)技術(shù)手段保障個人信息采集安全合規(guī);從立法角度看,應(yīng)從國家層面明確數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)加工者和產(chǎn)品使用者在數(shù)據(jù)生產(chǎn)、采集、加工、應(yīng)用等過程中的責(zé)任、權(quán)利和義務(wù),為保護各主體在數(shù)據(jù)交易過程中產(chǎn)生的多重權(quán)益主張,建立相應(yīng)的數(shù)據(jù)產(chǎn)權(quán)法律保障。公平權(quán)益分配機制可激發(fā)各主體數(shù)據(jù)共享能動性,降低數(shù)據(jù)溝通和使用成本,有效平衡不同訴求間的關(guān)系。
第四,研制數(shù)據(jù)治理工具集,保障數(shù)據(jù)治理機制落地。數(shù)據(jù)治理過程中所使用的各種工具和技術(shù)手段,是數(shù)據(jù)治理機制得以實現(xiàn)的基礎(chǔ)保障,目前還存在若干問題。一方面,工具功能不足。當(dāng)前數(shù)據(jù)治理工具的功能未能與時俱進,版本迭代緩慢,彼此相對獨立,難以應(yīng)對數(shù)據(jù)快速增長的復(fù)雜局面,不能保證數(shù)據(jù)收集、存儲、處理、分享、共享環(huán)節(jié)的高效運行,削弱了數(shù)據(jù)治理機制塑造和落地實踐的可能性。另一方面,工具使用能力不足。使用工具者依舊采用傳統(tǒng)方式或者傳統(tǒng)工具進行數(shù)據(jù)治理,對新治理工具缺乏了解與認知,缺乏使用和優(yōu)化數(shù)據(jù)治理工具的技能。
為此,面對數(shù)據(jù)治理工具不足的問題,應(yīng)加大數(shù)據(jù)治理工具的研發(fā)投入,充分利用大數(shù)據(jù)、人工智能等新興技術(shù)促進數(shù)據(jù)治理工具的智能化;促進產(chǎn)學(xué)研合作,整合各方資源和優(yōu)勢,共同研制先進的數(shù)據(jù)治理工具,加快數(shù)據(jù)治理工具的創(chuàng)新和迭代速度;制定數(shù)據(jù)治理工具的行業(yè)標(biāo)準,規(guī)范數(shù)據(jù)治理工具的功能要求和性能指標(biāo),推動數(shù)據(jù)治理工具的規(guī)范化和互聯(lián)互通。面對工具使用能力不足的問題,應(yīng)加強數(shù)據(jù)治理相關(guān)交叉學(xué)科建設(shè)和培訓(xùn)課程的開發(fā),培養(yǎng)既懂專業(yè)領(lǐng)域知識又熟練掌握治理工具的復(fù)合型人才;建立專家咨詢機制,聘請數(shù)據(jù)治理領(lǐng)域?qū)<覟槠髽I(yè)和機構(gòu)提供治理工具使用的指導(dǎo)和咨詢,幫助解決實際應(yīng)用中遇到的問題;調(diào)研數(shù)據(jù)治理工具使用的最佳實踐案例,通過研討會、行業(yè)交流會等形式作分享和推廣,幫助更多人了解和學(xué)習(xí)先進經(jīng)驗。
黨中央在進一步全面深化改革的戰(zhàn)略部署中,提出“促進各類先進生產(chǎn)要素向發(fā)展新質(zhì)生產(chǎn)力集聚”的任務(wù)。推進中國生成式人工智能技術(shù)的高質(zhì)量發(fā)展,是一件具有戰(zhàn)略意義的重要工作。以趨利避害、安全使用為保證,真正體現(xiàn)出它的革命性和引領(lǐng)性屬性,必須在凝聚治理合力上強調(diào)數(shù)據(jù)多元主體共商、共識、共建、共享、共治,在構(gòu)建安全評估評價體系上主張安全與發(fā)展并重,在數(shù)據(jù)確權(quán)授權(quán)上優(yōu)化權(quán)責(zé)配置體系,在治理工具開發(fā)上重視互聯(lián)互通與時俱進,在人才培養(yǎng)上應(yīng)強化學(xué)科交叉建設(shè),積極打造人工智能數(shù)據(jù)治理主力軍,建立起立足國情、開放共享、可信可靠、安全合規(guī)、敏捷高效、自立自信的數(shù)據(jù)治理新技術(shù)、新方案、新生態(tài)。
作者系中國社會科學(xué)院大學(xué)文學(xué)院教授
來源:中國社會科學(xué)報
新媒體編輯:崔岑
如需交流可聯(lián)系我們
點個“在看”不失聯(lián)