近日,北京app開發(fā)小編從河北新網(wǎng)看到一篇《大咖論“數(shù)” | 增強AI時代數(shù)據(jù)安全》的文章,分享給大家。
數(shù)據(jù)安全貫穿數(shù)據(jù)全生命周期。狹義的數(shù)據(jù)安全是免受篡改和破壞。廣義的數(shù)據(jù)安全包括數(shù)據(jù)的可靠性、數(shù)據(jù)安全性、服務和內容的安全性,在人工智能時代還會擴展數(shù)據(jù)安全的內涵,當然也會放大數(shù)據(jù)安全的風險。

數(shù)據(jù)安全包括從數(shù)據(jù)采集、數(shù)據(jù)融合、服務生成到內容應用等環(huán)節(jié)的安全。首先是網(wǎng)絡基礎設施方面涉及數(shù)據(jù)的可靠性,包括傳輸鏈路可靠性、算力節(jié)點、數(shù)據(jù)中心、數(shù)據(jù)庫包括存儲設備可靠性。二是數(shù)據(jù)安全技術,包括身份識別、數(shù)據(jù)屬性、數(shù)據(jù)流動管理、數(shù)據(jù)加密水印等。三是數(shù)據(jù)服務與內容安全技術,包括數(shù)據(jù)所有權管理技術、數(shù)據(jù)交易技術管理、開放共享管理、人工智能深度防偽、AI幻覺的控制、AI服務的數(shù)據(jù)內容合規(guī)等。
數(shù)據(jù)中心的災備需要重點考慮。我們國家對數(shù)據(jù)災備建設有投資,但是災備往往能力不足,現(xiàn)在就需要加強對數(shù)據(jù)的異地容災備份。大家都希望容災的時候數(shù)據(jù)不丟失或者說丟失量很低,過去災備的間隔是一天主備復制一次,在丟失的時候可能會丟一天的數(shù)據(jù),但現(xiàn)在可能要縮短到一小時復制一次,而且復制的鏈路可靠性要求很高、時延要求更低。災備需要對數(shù)據(jù)定期復制。但是,數(shù)據(jù)復制間隔越密,它的效率就越低。從數(shù)據(jù)丟失開始到真正切換還有故障識別、故障判斷的過程,這段時間可能會影響數(shù)據(jù),在恢復正常之后還要再切回去。利用分布的公有云做容災備份是發(fā)展趨勢。
實際上,在數(shù)據(jù)中心內部也仍存在安全問題。數(shù)據(jù)中心內部本身要做到無損,但往往有些時候單個算力節(jié)點能力不足,就導致需要動員多節(jié)點來協(xié)同,算力節(jié)點間需要大容量光傳輸鏈路,因此對光傳輸鏈路的時延、丟包會有嚴格的要求。
不同類型的數(shù)據(jù)對安全要求不同,我們需要識別數(shù)據(jù)是國家機密數(shù)據(jù)、企業(yè)秘密數(shù)據(jù)還是涉及大量用戶敏感信息數(shù)據(jù)。過去的互聯(lián)網(wǎng)沒有識別,不知道所承載的數(shù)據(jù)是什么,現(xiàn)在有了IPv6,可以對源地址和目的地地址驗證,還可利用APN6(應用感知)和iFIT(隨流檢測)可以知道這個數(shù)據(jù)源端使用者的身份和對信道服務質量的要求,還可實時獲得信道的時延、抖動、丟包率等性能參數(shù)。這樣可以實現(xiàn)路徑溯源,從而支持數(shù)據(jù)跨境流動管理。
網(wǎng)絡安全是數(shù)據(jù)安全的基礎,一般來說,通過加密可以保護數(shù)據(jù)。但是加密數(shù)據(jù)也可能被勒索病毒再次加密,需實時對軟件版本進行核對與接入審計。盡管我們很重視網(wǎng)絡安全,但是也不能因為安全而不促進數(shù)據(jù)的流通、不促進數(shù)據(jù)的應用。企業(yè)雙方都想利用對方的數(shù)據(jù),但是都不愿意把自身的原始數(shù)據(jù)交給對方,如果交給第三方,也不一定相信第三方的公正和安全。
現(xiàn)在可以利用隱私計算和多方同態(tài)加密的技術,選擇一個特定的密鑰,讓數(shù)據(jù)加密以后計算結果等效于沒有加密的計算,就能實現(xiàn)數(shù)據(jù)可用不可見。通過這種辦法可以實現(xiàn)數(shù)據(jù)的融合。現(xiàn)在還有一種技術,把企業(yè)的數(shù)據(jù)打散了之后分布式進行存儲,然后加入密鑰的控制,可以按需根據(jù)對方企業(yè)的需要把數(shù)據(jù)調入沙箱,然后再進行解密計算,這相對來講比同態(tài)加密要簡單。
人工智能的出現(xiàn)讓數(shù)據(jù)可信性面臨挑戰(zhàn)。因為生成式大模型是基于統(tǒng)計和模式識別的,別看它有上下文的關聯(lián),但是并不等于全局性和對物理世界的透徹了解,而且有些場合的數(shù)據(jù)很少。訓練數(shù)據(jù)少,訓練的場景缺失,可能會出現(xiàn)低級錯誤甚至常識性錯誤。另外,數(shù)據(jù)可能是受到干擾的。在大模型訓練的時候也會受到無意的或者惡意的誘導,會使AI誤判。AI應用會增加很多的挑戰(zhàn)。
為應對這些挑戰(zhàn),要加強數(shù)據(jù)質量控制,使用高質量多樣化的數(shù)據(jù)訓練。要對算法優(yōu)化和模型評估改進,定期審查和測試。需要開展倫理審查,特別是對可能產生重大社會影響的應用進行事先審批,幫助用戶理解AI的運作方式和潛在風險。還可利用區(qū)域截圖、放大縮小等預處理發(fā)現(xiàn)數(shù)據(jù)被篡改或AI被濫用,進一步保障數(shù)據(jù)安全。以上是手機app開發(fā)小編轉自河北新聞網(wǎng)(作者鄔賀銓 系中國工程院院士、中國互聯(lián)網(wǎng)協(xié)會專家咨詢委員會主任)。
掃一掃 了解更多
我們能給的,遠比您想的更多
服務于上市公司及500強等知名企業(yè)
010-53668213