AIGC數據三大隐患,企業該如何規避風險?
發布時間:2023-08-27 來源:華然咨詢
随着人工(gōng)智能(néng)技(jì )術的不斷演進, AIGC正日益成為(wèi)信息生産(chǎn)的主要方式之一。然而,與其嶄新(xīn)的産(chǎn)業前景相伴的是AIGC合規問題的迫切性與嚴重性,這是每一個從業者都應認真思考的命題。
一、數據隐私洩露,第一隐患
在普通用(yòng)戶或個體(tǐ)中(zhōng),隐私和信息安(ān)全意識尚未充分(fēn)覺醒。但對于涉及高度保密性的行業,例如金融機構等,數據洩露的風險極高。以ChatGPT為(wèi)例,用(yòng)戶所輸入的各類信息将經由美國(guó)服務(wù)器傳輸,再返回用(yòng)戶端。然而這個過程中(zhōng),用(yòng)戶數據已經不經意地跨境流出。
“确保用(yòng)戶及相關方的信息安(ān)全,遵循隐私保護法,不向模型輸入個人信息。訓練數據集需要經過合規清洗和數據處理(lǐ),并留存相關記錄日志(zhì)。”
二、數據來源合法性,三方合作(zuò)要注意
在“酷米客訴車(chē)來不正當競争糾紛案”中(zhōng),法院認為(wèi),未經權利人許可(kě),利用(yòng)網絡爬蟲技(jì )術進入權利人的服務(wù)器後台的方式非法獲取并無償使用(yòng)權利人的實時公(gōng)交信息數據的行為(wèi),實為(wèi)一種“不勞而獲”、“食人而肥”的行為(wèi),且具(jù)有(yǒu)非法占用(yòng)他(tā)人無形财産(chǎn)權益,破壞他(tā)人市場競争優勢,構成不正當競争。
“合規需要前置審核開源數據源和與第三方的合作(zuò)協議,避免與第三方合作(zuò)權責不清導緻的合規法律風險;同時,要遵循三方協議約束,動态更新(xīn)合規策略。”
三、數據質(zhì)量不容忽視,嚴格把關。
暫行辦(bàn)法對數據标識和數據質(zhì)量都提出了要求,如果訓練和微調沒有(yǒu)做好質(zhì)量把控,那麽輸出内容亦無法保障。在部署和訓練過程,都需要做好一套數據标注規則,對操作(zuò)者實施安(ān)全培訓。
随着法規的逐步完善,企業在數據隐私、信息真實性和數據獲取途徑等方面都将迎來更高的合規要求。下一篇,将重點講講,内容合規。
華然咨詢于2022年組建AI技(jì )術服務(wù)團隊,為(wèi)企業客戶提供AI轉型整體(tǐ)解決方案。