ChatGPT應(yīng)用爆火,安全的大數(shù)據(jù)底座何處尋?
在人工智能飛速發(fā)展的今天,好像哪個(gè)企業(yè)不參與就會(huì)被時(shí)代拋下。然而,AI運(yùn)行的核心離不開海量的數(shù)據(jù)支持,其背后帶來(lái)的數(shù)據(jù)安全問(wèn)題令各行業(yè)擔(dān)憂,建立數(shù)據(jù)安全防護(hù)墻迫在眉睫。本文作者對(duì)此進(jìn)行了分析,希望對(duì)你有幫助。
毫無(wú)疑問(wèn),AIGC正在給人類社會(huì)帶來(lái)一場(chǎng)深刻的變革。
而剝開其令人眼花繚亂的華麗外表,運(yùn)行的核心離不開海量的數(shù)據(jù)支持。
ChatGPT的“入侵”已經(jīng)引起了各行各業(yè)對(duì)內(nèi)容抄襲的擔(dān)憂,以及網(wǎng)絡(luò)數(shù)據(jù)安全意識(shí)的提高。
雖然AI技術(shù)是中立的,但并不能成為規(guī)避責(zé)任與義務(wù)的理由。
最近,英國(guó)情報(bào)機(jī)構(gòu)——英國(guó)政府通訊總部(GCHQ)警告稱,ChatGPT和其他人工智能聊天機(jī)器人將是一個(gè)新的安全威脅。
盡管ChatGPT的概念出現(xiàn)沒(méi)有多久,但對(duì)網(wǎng)絡(luò)安全和數(shù)據(jù)安全帶來(lái)威脅的問(wèn)題已經(jīng)成為業(yè)內(nèi)關(guān)注的焦點(diǎn)。
對(duì)于目前還處于發(fā)展初期的ChatGPT,如此擔(dān)憂是否杞人憂天?
一、安全威脅或正在發(fā)生
去年年底,初創(chuàng)公司OpenAI推出ChatGPT,之后,其投資商微軟于今年推出了基于ChatGPT技術(shù)開發(fā)的聊天機(jī)器人“必應(yīng)聊天(Bing Chat)”。
由于此類軟件能夠提供酷似人類的對(duì)話,目前這項(xiàng)服務(wù)已風(fēng)靡全球。
GCHQ的網(wǎng)絡(luò)安全部門指出,提供AI聊天機(jī)器人的公司可以看到用戶輸入的查詢內(nèi)容,就ChatGPT而言,其開發(fā)商OpenAI就能夠看到這些。
ChatGPT通過(guò)大量文本語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,其深度學(xué)習(xí)能力很大程度上依賴于背后的數(shù)據(jù)。
出于對(duì)信息泄露的擔(dān)憂,目前已有多家公司和機(jī)構(gòu)發(fā)布“ChatGPT禁令”。
倫敦金融城律師事務(wù)所Mishcon de Reya禁止其律師將客戶數(shù)據(jù)輸入ChatGPT,因?yàn)閾?dān)心在法律上享有隱私特權(quán)的資料可能會(huì)遭泄露。
國(guó)際咨詢公司埃森哲警告其全球70萬(wàn)名員工,出于類似的原因,不要使用ChatGPT,因?yàn)閾?dān)心客戶的機(jī)密數(shù)據(jù)最終會(huì)落入他人之手。
英國(guó)電腦芯片公司Arm的母公司日本軟銀集團(tuán)同樣警告其員工,不要向人工智能聊天機(jī)器人輸入公司人員的身份信息或機(jī)密數(shù)據(jù)。
今年2月,摩根大通成為第一家在工作場(chǎng)所限制使用ChatGPT的華爾街投行。
花旗集團(tuán)和高盛集團(tuán)緊隨其后,前者禁止員工在整個(gè)公司范圍內(nèi)訪問(wèn)ChatGPT,后者則限制員工在交易大廳使用該產(chǎn)品。
而在更早些時(shí)候,亞馬遜和微軟為防備員工在使用ChatGPT的過(guò)程中泄密,禁止他們向其分享敏感數(shù)據(jù),因?yàn)檫@些信息可能會(huì)被用作進(jìn)一步迭代的訓(xùn)練數(shù)據(jù)。
事實(shí)上,這些人工智能聊天機(jī)器人背后是大型語(yǔ)言模型(LLM),用戶的這些查詢內(nèi)容將會(huì)被存儲(chǔ)起來(lái),并且會(huì)在未來(lái)某個(gè)時(shí)候被用于開發(fā)LLM服務(wù)或模型。
這就意味著,LLM提供商能夠讀取到相關(guān)查詢,并可能以某種方式將它們合并到未來(lái)的版本中。
盡管LLM運(yùn)營(yíng)商應(yīng)該采取措施保護(hù)數(shù)據(jù),但不能完全排除未經(jīng)授權(quán)訪問(wèn)的可能性。因此,企業(yè)需要確保他們有嚴(yán)格的政策,提供技術(shù)性支持,來(lái)監(jiān)控LLM的使用,以最大限度地降低數(shù)據(jù)暴露的風(fēng)險(xiǎn)。
另外,盡管ChatGPT本身尚不具備直接攻擊網(wǎng)絡(luò)安全和數(shù)據(jù)安全的能力,但是由于它具有自然語(yǔ)言生成和理解的能力,可以被用于偽造虛假信息、攻擊社交工程等方面。
此外,攻擊者還可以使用自然語(yǔ)言來(lái)讓ChatGPT生成相應(yīng)的攻擊代碼、惡意軟件代碼、垃圾郵件等。
因此,AI可以讓那些原本沒(méi)有能力發(fā)起攻擊的人基于AI生成攻擊,并大大提高攻擊成功率。
在自動(dòng)化、AI、“攻擊即服務(wù)”等技術(shù)和模式加持下,網(wǎng)絡(luò)安全攻擊呈現(xiàn)出暴漲趨勢(shì)。
在ChatGPT火爆之前,已發(fā)生了多次黑客使用AI技術(shù)進(jìn)行的網(wǎng)絡(luò)攻擊。
事實(shí)上,人工智能被用戶調(diào)教“帶偏節(jié)奏”的案例并不鮮見,6年前,微軟推出智能聊天機(jī)器人Tay,上線時(shí),Tay表現(xiàn)得彬彬有禮,但不到24小時(shí),其就被不良用戶“帶壞”,出言不遜、臟話不斷,言語(yǔ)甚至涉及種族主義、色情、納粹,充滿歧視、仇恨和偏見,只好被下線結(jié)束了短暫的生命。
另一方面,距離用戶更近的風(fēng)險(xiǎn)是,用戶在使用ChatGPT等AI工具時(shí),可能會(huì)不經(jīng)意間將私密數(shù)據(jù)輸入到云端模型,這些數(shù)據(jù)可能成為訓(xùn)練數(shù)據(jù),也可能成為提供給他人答案的一部分,從而導(dǎo)致數(shù)據(jù)泄露和合規(guī)風(fēng)險(xiǎn)。
二、AI應(yīng)用要打好安全底座
ChatGPT作為大語(yǔ)言模型,其核心邏輯事實(shí)上是海量數(shù)據(jù)的收集、加工、處理和運(yùn)算結(jié)果的輸出。
總的來(lái)說(shuō),這幾個(gè)環(huán)節(jié)可能會(huì)在技術(shù)要素、組織管理、數(shù)字內(nèi)容三個(gè)方面伴生相關(guān)風(fēng)險(xiǎn)。
雖然ChatGPT表示,存儲(chǔ)訓(xùn)練和運(yùn)行模型所需的數(shù)據(jù)會(huì)嚴(yán)格遵守隱私和安全政策,但在未來(lái)可能出現(xiàn)網(wǎng)絡(luò)攻擊和數(shù)據(jù)爬取等現(xiàn)象,仍存在不可忽視的數(shù)據(jù)安全隱患。
特別是涉及國(guó)家核心數(shù)據(jù)、地方和行業(yè)重要數(shù)據(jù)以及個(gè)人隱私數(shù)據(jù)的抓取、處理以及合成使用等過(guò)程,需平衡數(shù)據(jù)安全保護(hù)與流動(dòng)共享。
除了數(shù)據(jù)與隱私泄露隱患外,AI技術(shù)還存在著數(shù)據(jù)偏見、虛假信息、模型的難解釋性等問(wèn)題,可能會(huì)導(dǎo)致誤解和不信任。
風(fēng)口已至,AIGC浪潮奔涌而來(lái),在前景向好的大背景下,關(guān)口前移,建立數(shù)據(jù)安全防護(hù)墻也至關(guān)重要。
尤其是當(dāng)AI技術(shù)逐漸完善,它既能成為生產(chǎn)力進(jìn)步的有力抓手,又易淪為黑產(chǎn)犯罪的工具。
奇安信威脅情報(bào)中心監(jiān)測(cè)數(shù)據(jù)顯示,2022年1月份-10月份,超過(guò)950億條的中國(guó)境內(nèi)機(jī)構(gòu)數(shù)據(jù)在海外被非法交易,其中有570多億條是個(gè)人信息。
因此,如何確保數(shù)據(jù)存儲(chǔ)、計(jì)算、流通過(guò)程中的安全問(wèn)題,是數(shù)字經(jīng)濟(jì)發(fā)展的大前提。
從整體看,應(yīng)該堅(jiān)持頂層設(shè)計(jì)與產(chǎn)業(yè)發(fā)展齊頭并進(jìn),在《網(wǎng)絡(luò)安全法》的基礎(chǔ)上,要細(xì)化風(fēng)險(xiǎn)與責(zé)任分析體系,確立安全問(wèn)責(zé)機(jī)制。
同時(shí),監(jiān)管部門可開展常態(tài)化監(jiān)查工作,安全領(lǐng)域企業(yè)協(xié)同發(fā)力,構(gòu)建全流程數(shù)據(jù)安全保障體系。
對(duì)于數(shù)據(jù)合規(guī)和數(shù)據(jù)安全的問(wèn)題,特別是在《數(shù)據(jù)安全法》推出后,數(shù)據(jù)隱私越來(lái)越重要。
如果在應(yīng)用AI技術(shù)的過(guò)程中無(wú)法保證數(shù)據(jù)安全和合規(guī),可能會(huì)給企業(yè)造成很大風(fēng)險(xiǎn)。
特別是中小企業(yè)對(duì)數(shù)據(jù)隱私安全方面的知識(shí)比較匱乏,不知道應(yīng)當(dāng)如何保護(hù)數(shù)據(jù)不會(huì)受到安全威脅。
數(shù)據(jù)安全合規(guī)并不是某個(gè)部門的事情,而是整個(gè)企業(yè)最為重要的事情。
企業(yè)要對(duì)員工進(jìn)行培訓(xùn),讓他們意識(shí)到每個(gè)使用數(shù)據(jù)的人,都有義務(wù)保護(hù)數(shù)據(jù),包括IT人員、AI部門、數(shù)據(jù)工程師、開發(fā)人員、使用報(bào)表的人等,人和技術(shù)要結(jié)合在一起。
面對(duì)前述潛藏風(fēng)險(xiǎn),監(jiān)管方和相關(guān)企業(yè)如何從制度和技術(shù)層面加強(qiáng)AIGC領(lǐng)域的數(shù)據(jù)安全保護(hù)?
相較于直接針對(duì)用戶終端采取限制使用等監(jiān)管措施,明確要求AI技術(shù)研發(fā)企業(yè)遵循科技倫理原則會(huì)更具成效,因?yàn)檫@些企業(yè)能夠在技術(shù)層面限定用戶的使用范圍。
在制度層面,需要結(jié)合AIGC底層技術(shù)所需數(shù)據(jù)的特性和作用,建立健全數(shù)據(jù)分類分級(jí)保護(hù)制度。
例如,可根據(jù)數(shù)據(jù)主體、數(shù)據(jù)處理程度、數(shù)據(jù)權(quán)利屬性等方面對(duì)訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分類管理,根據(jù)數(shù)據(jù)對(duì)于數(shù)據(jù)權(quán)利主體的價(jià)值,以及數(shù)據(jù)一旦遭到篡改、破壞等對(duì)數(shù)據(jù)主體的危害程度進(jìn)行分級(jí)。
在數(shù)據(jù)分類分級(jí)的基礎(chǔ)上,建立與數(shù)據(jù)類型和安全級(jí)別相配套的數(shù)據(jù)保護(hù)標(biāo)準(zhǔn)與共享機(jī)制。
目光投向企業(yè),還需加快推動(dòng)“隱私計(jì)算”技術(shù)在AIGC領(lǐng)域的應(yīng)用。
這類技術(shù)能夠讓多個(gè)數(shù)據(jù)擁有者在不暴露數(shù)據(jù)本身的前提下,通過(guò)共享SDK或者開放SDK權(quán)限的方式,在進(jìn)行數(shù)據(jù)的共享、互通、計(jì)算、建模,在確保AIGC能夠正常提供服務(wù)的同時(shí),保證數(shù)據(jù)不泄露給其他參與方。
此外,全流程合規(guī)管理的重要性愈加凸顯。
企業(yè)首先應(yīng)關(guān)注其所運(yùn)用的數(shù)據(jù)資源是否符合法律法規(guī)要求,其次要確保算法和模型運(yùn)作的全流程合規(guī),企業(yè)的創(chuàng)新研發(fā)還應(yīng)最大限度地滿足社會(huì)公眾的倫理期待。
同時(shí),企業(yè)應(yīng)制定內(nèi)部管理規(guī)范,設(shè)立相關(guān)的監(jiān)督部門,對(duì)AI技術(shù)應(yīng)用場(chǎng)景的各個(gè)環(huán)節(jié)進(jìn)行數(shù)據(jù)監(jiān)督,確保數(shù)據(jù)來(lái)源合法、處理合法、輸出合法,從而保障自身的合規(guī)性。
AI應(yīng)用的關(guān)鍵在于部署方式與成本間的考量,但必須注意的是,如果沒(méi)有做好安全合規(guī)、隱私保護(hù),對(duì)企業(yè)來(lái)說(shuō)或?qū)⑻N(yùn)含“更大風(fēng)險(xiǎn)點(diǎn)”。
AI是把雙刃劍,用得好讓企業(yè)如虎添翼;用不好疏忽了安全、隱私和合規(guī),會(huì)給企業(yè)帶來(lái)更大損失。因此,在AI應(yīng)用前,需要構(gòu)筑更加穩(wěn)固的“數(shù)據(jù)底座”,正所謂,行穩(wěn)方能致遠(yuǎn)。
本文由@科技云報(bào)到 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!