隨著AI技術的飛速發展,AI訓練數據的合規性、倫理和安全問題日益受到社會各界的廣泛關注。
近日,國內《人工智能法示范法2.0(專家建議稿)》(以下簡稱“《示范法》2.0”)發布,進一步明晰開源激勵、版權風險治理機制,更好護航人工智能安全發展。在美國,近期一份名為《生成式AI版權披露法案》(以下簡稱“《法案》2.0”)的提案同樣在國會被推出,旨在迫使人工智能公司披露其生成AI模型所使用的受版權保護的材料。
國內外同時在AI規范發展方面出臺相關規定,意味著AI正在巨大潛力與道德準則、法律規范和產業發展的迫切需求之間找到平衡。作為人工智能發展的主體,以萬興科技Adobe等為代表的AI公司正努力通過構建全生命周期的科技倫理審查體系建設、采購合法合規的訓練數據,確保走在AI發展的科技向善道路上,打造可審核、可監督、可追溯、可信賴的人工智能技術。
萬興科技等AI公司積極成立科技倫理審查委員會
《示范法》2.0在構建知識產權創新規則方面,在研發環節對訓練數據、個人信息的使用作出專門安排,并針對人工智能生成物的成果保護與侵權認定進行規定,平衡好人工智能發展與安全之間的關系。
事實上,作為人工智能發展的主體,不少人工智能公司早已迅速行動,以國內AIGC軟件A股龍頭公司萬興科技(300624.SZ)為例,其在4月10日成功獲得湖南省人工智能領域第一批科技倫理審查機構登記證書,獲得人工智能科技倫理審查機構登記備案,一同獲得登記備案的視旅科技、芒果融創等。
公開資料顯示,萬興科技是中國數字創意軟件領域產品覆蓋面廣、營收體量大、全球化程度高的A股上市公司,也是國內AIGC行業龍頭,業務覆蓋200多個國家和地區,全球累計用戶超15億,月活近1億,被視為“中國版Adobe”。
面對AIGC時代,萬興科技深化布局,今年一月,萬興科技推出中國首個音視頻多媒體創作垂類大模型萬興“天幕”,聚焦數字創意垂類創作場景,基于15億用戶行為及百億本土化高質量音視頻數據沉淀,打造基于大模型架構的AIGC應用基礎底座,全鏈路賦能全球創作者,推進大模型進入2.0時代。據悉,該大模型當前已成功通過中央網信辦備案,即將于4月28日開放公測。
萬興科技相關負責人介紹,公司高度重視人工智能科技倫理工作,在湖南省科技廳的指導下,成立萬興科技(湖南)人工智能科技倫理審查委員會,起草并通過科技廳審核各類規章制度和SOP數十項,幫助公司對AI項目的倫理風險進行評估和管理,提升科技倫理審查水平。通過對大模型研發及其應用方面進行全生命周期的科技倫理審查體系建設,為公司在AI領域的研發和應用系上安全帶。
在各省科技倫理委員會的指導和牽引下,各人工智能公司在落實推動人工智能倫理規范發展主體責任方面正起著不可替代的指導作用。
在湖南,省科技廳專門成立人工智能科技倫理服務專班,開展人工智能科技倫理服務需求調研,指導人工智能科研機構成立科技倫理審查機構,專門組織人工智能領域科技倫理業務能力提升培訓等,推動人工智能科技創新和科技倫理互動良性發展。
無獨有偶,今年1月,浙江省發布《關于加快人工智能產業發展的指導意見》,提出加強省科技倫理委員會的作用,加強人工智能倫理安全規范、社會治理實踐研究,面向重點領域開展倫理審查和安全評估;推動相關高校院所、企業等按規定設立人工智能倫理(審查)委員會,持續強化科技倫理對科技創新主體的正向引導。
Adobe采購視頻資源訓練AI模型規避版權爭議
近期,美國《法案》的提案引起科技界廣泛關注。該法案要求AI公司在使用受版權保護的作品進行模型訓練時,必須進行披露。這一要求意味著AI企業需要對其訓練數據的來源和使用情況進行透明化管理,確保數據使用的合法性和合規性。目前該法案已獲得包括美國唱片業協會、職業攝影師協會、導演協會和電視廣播藝人協會等多個娛樂行業組織和工會的支持。
在國際上,Adobe公司正積極采購視頻資源以訓練其AI模型。業內人士認為,Adobe作為全球知名的創意軟件公司,其對AI技術的投入和應用一直處于行業前沿。通過購買視頻資源,Adobe不僅能夠為其AI模型提供高質量的訓練數據,還能夠確保數據的合法來源,避免潛在的版權糾紛。
與此同時,Adobe還警告稱,不要提供受版權保護的材料、裸體或其他“冒犯性內容”,Adobe的清單內容還突出了構建AI模型所需的大量數據,并表示這些數據將用來為人工智能訓練提供算料資料,加快開發文生視頻技術。
與Adobe公司采取購買訓練數據不同,最早推出文生視頻模型Sora的OpenAI則正面臨訓練數據來源的壓力。
OpenAI首席技術長Mira Murati在3月接受采訪時表示,她不確定Sora是否接受過YouTube、Facebook和Instagram用戶生成的視頻用于培訓。
Mira Murati的含糊其辭引發業界對Open AI訓練數據來源的質疑。YouTube首席執行官Neal Mohan公開表示,雖然沒有直接證據證明Open AI利用YouTube視頻訓練Sora,但如果事實確實如此,那OpenAI就“明顯違反”YouTube的使用條款。
相比之下,Adobe所尋求的直接付費向攝影師和藝術家們采購視頻的做法,被認為更為合規,AI模型訓練數據來源顯然更為安全。除了視頻資源,它還為提交大量用于人工智能訓練的照片的貢獻者提供報酬。
《法案》提案和《示范法》2.0,以及國內外企業的實踐表明,AI行業正在逐步建立起一套完善的數據管理和披露機制,以確保數據使用的合法性和倫理規范。這對于推動AI行業的健康發展,知識產權保護,以及維護社會公共利益顯然具有重要意義。
未來,隨著相關AI法律法規的不斷完善和行業標準的逐步建立,AI企業在數據合規和倫理安全方面的表現也有望成為衡量其在社會責任、企業信譽的重要指標,成為AI企業軟性競爭力的關鍵一環。