ChatGPT很厲害,但還有關(guān)鍵問題懸而未決
ChatGPT被應用的領域越來越廣,人們感嘆其能力的同時,也開始擔憂AI生成內(nèi)容的倫理和法律問題,如:如何分辨一篇文章的“作者”到底是人還是機?AI的抄襲、剽竊和作弊涉及的版權(quán)問題又該如何處理?文章中提到了AI背后的學術(shù)隱憂,以及AI引發(fā)版權(quán)問題,歡迎探討與思考。
1月27日,路透社消息稱法國頂尖學府之一的巴黎政治學院宣布該校將禁止使用ChatGPT,對使用該軟件的處罰可能會嚴重到被學校開除,甚至被整個法國高等教育開除。
“ChatGPT軟件正在向全世界的教育工作者和研究人員提出一個涉及欺詐和剽竊的嚴肅問題,”巴黎政治學院在這份通知中稱,“在沒有透明參考的情況下,除特定課程目的外,學生不得使用該軟件制作任何書面作品或演示文稿?!?/p>
巴黎政治學院并不是第一所宣布禁用ChatGPT的學校。ChatGPT發(fā)布不到一個月,就引起了美國教育界的高度重視。多所美國中學及大學陸續(xù)宣布校內(nèi)禁用ChatGPT,并通過減少課后作業(yè)的方式,避免學生利用家庭網(wǎng)絡訪問ChatGPT作弊。美國紐約市教育部,甚至要求全紐約市的學生和教師不要使用這款AI工具,并對下轄的教育部設備或互聯(lián)網(wǎng)設卡,限制訪問ChatGPT。
AI生成內(nèi)容的倫理和法律問題,正在引發(fā)社會各界的廣泛討論與思考。
01 AI背后的學術(shù)隱憂
“ChatGPT很好玩,但它不是作者”,這是《Science》期刊主編Holden Thorp在1月26日發(fā)表的一篇關(guān)于人工智能的社論。Holden Thorp指出,“原創(chuàng)”是Science發(fā)表論文的基礎,而利用ChatGPT編寫文本的行為,等同于從ChatGPT中抄襲。
“我們正在更新編輯政策,要求作者不要使用ChatGPT(或任何其他人工智能工具)生成的文本、數(shù)據(jù)、圖像或是圖形。違反這一政策將被Science期刊視為學術(shù)不端行為,這與篡改圖像或抄襲無異。”不過Holden Thorp也表示,上述規(guī)定并不包含AI論文中以研究為目的生成的數(shù)據(jù)。
在AI學界,知名機器學習會議之一的ICML(International Conference on Machine Learning)最近也宣布禁止“發(fā)表包含從大型語言模型(LLM,Large Language Model)生成的文本(例如 ChatGPT)的論文(相關(guān)研究除外)”,以免出現(xiàn)“意想不到的后果和無法解決的問題”。
對于學術(shù)期刊和頂會論文來說,AI生成的內(nèi)容最大的問題在于知識權(quán)屬和責任確定問題。作為論文作者,研究人員無疑要對論文的觀點和內(nèi)容負責,而AI要如何對文章內(nèi)容負責?如果AI生成的內(nèi)容出現(xiàn)了謬誤、不恰當、造假,甚至是抄襲剽竊,又該如何追責呢?
考慮到“AI作弊”帶來的普遍問題,目前從OpenAI官方,到學術(shù)期刊出版商,以及“草根”開發(fā)者都在研究如何分辨一篇文章的“作者”到底是人還是機?
目前,OpenAI正在研發(fā)相應的AI檢測工具。OpenAI客座研究員Scott Aaronson在德克薩斯大學的一次演講中表示,他們正在通過給AI生成內(nèi)容打“水印”來打擊作弊。這項技術(shù)將通過調(diào)整ChatGPT生成單詞的規(guī)則,在生成內(nèi)容的特定位置制造“偽隨機”的特定單詞,讀者很難察覺,但就如同密電碼一樣,“握有密鑰”的人就輕易判斷這篇內(nèi)容是否是ChatGPT生成的了。
《Nature》的出版商Springer Nature也正在開發(fā)可以檢測LLM的技術(shù)。而就在前不久,普林斯頓大學的一位22歲的華裔學生Edward Tian研究出了一款專門給ChatGPT挑毛病的應用GPTZero,可以通過檢測文本的“困惑性(Perplexity)”和“突發(fā)性(Burstiness)”這兩項指標,來判斷內(nèi)容是人類創(chuàng)作還是機器生成。
02 AI引發(fā)版權(quán)問題
在校外,AI本身的“道德”問題,則讓美術(shù)“老師”們對新生的AI繪圖工具提出了嚴重的質(zhì)疑,這直指另一個至關(guān)重要的問題——版權(quán)。
自從AIGC火了以后,很多行業(yè)的配圖工作變得輕松了許多。以媒體行業(yè)為例,嚴肅媒體對新聞配圖要求高,既要符合文意,又要對版權(quán)負責。所以無論是美術(shù)作品還是照片,要么是親手創(chuàng)作,要么來自授權(quán)圖庫,但很多文章受客觀條件限制,要找到一張符合要求的配圖并不容易。
有了AI繪圖以后,很多媒體人開始嘗試用AI畫配圖,甚至是直接繪制新聞人物的肖像。那發(fā)自己用AI做的圖,總不會侵權(quán)吧?這個問題,還真不一定。
2022年下半年,AIGC剛剛躥紅,就有一些小有名氣的藝術(shù)家對AI繪圖提出了抗議。2022年,Erin Hanson等眾多美國藝術(shù)家發(fā)起了反對Stable Diffusion的抗議行動,他們認為Stable Diffusion生成的部分畫作抄襲了他們的風格,而這種行為嚴重侵犯了他們的合法權(quán)益。
AIGC雖然叫做AI生成,但其本身并沒有創(chuàng)造能力,只能通過不斷學習人類的生產(chǎn)過程,照貓畫虎,AI繪圖就是典型。在AI訓練過程中,需要“投喂”大量的人類畫作,從而學習人類的構(gòu)圖、繪畫技巧,實現(xiàn)AIGC(AI Generative Content,AI生成內(nèi)容)。
不過在這個生成的過程中,AI學的實在太像了,以至于很多畫作直接與模型庫中的人類畫師風格完全一致。
“稍有名氣的畫師可能都遇到過作品被盜用、創(chuàng)意被侵權(quán)的事件。”一位國內(nèi)某知名游戲公司的美術(shù)總監(jiān)向虎嗅表示,雖然AI沒有完全盜用畫師的作品,但畫師對風格上的抄襲也是很難接受的,不論抄襲者是人類還是AI?!叭绻腥四弥c我繪圖風格完全一樣的畫,說是學習或是參考我覺得沒什么。但如果說這是他‘生成’的,那就跟聲明原創(chuàng)沒什么差別了。不管是否用于商業(yè)用途,我都會覺得被嚴重冒犯了。”
AI的抄襲、剽竊和作弊不應該只是道德問題,還需要法律法規(guī)的約束。而目前,AI在很多領域都存在法律盲區(qū)。
我國AI領域的立法還處于建章立制階段。當前已經(jīng)出臺了兩部與AI相關(guān)的監(jiān)管條例,分別是《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》和《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》,并均已開始生效。除此以外,還有一些分散在《民法典》、《數(shù)據(jù)安全法》、《網(wǎng)絡安全法》、《個保法》、《網(wǎng)絡音視頻信息服務管理規(guī)定》、《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》等法律法規(guī)中的個別條款規(guī)定以及一些支持產(chǎn)業(yè)發(fā)展性質(zhì)的文件,目前來說還沒有成為一個完整的體系。
“AI生成內(nèi)容是一項新興的技術(shù),法律的滯后性和穩(wěn)定性導致目前還沒有專門對這種AI疑似抄襲的現(xiàn)象進行規(guī)制。”觀韜中茂律師事務所合伙人王渝偉表示,從國外行業(yè)實踐來看,越來越多的平臺和AI繪圖工具對作品版權(quán)作出了嚴格要求,謹防AI抄襲導致著作權(quán)侵權(quán)。在我國,目前還是應當根據(jù)《著作權(quán)法》,判斷AI生成內(nèi)容與人類藝術(shù)家作品之間是否存在實質(zhì)性相似,進而認定是否抄襲。
除了涉嫌抄襲藝術(shù)家作品的AIGC內(nèi)容,在另一方面,即使是隨機生成的內(nèi)容及畫作,也還是會涉及版權(quán)問題。
AI繪圖在抖音和小紅書上剛剛興起之時,即有腦洞大開的網(wǎng)友提出,可以把AI生成的圖片掛到付費圖庫作為收費資源,實現(xiàn)“躺賺”。
面對這樣的騷操作,Adobe選擇“有限制”地開放AI繪圖。只要符合特定標準,就允許在圖片庫Adobe Stock中上傳生成式 AI 藝術(shù)品進行售賣。但上傳前必須標記 AI 制作的內(nèi)容,并且需要擁有其參考圖像或文本的商業(yè)版權(quán)。
作為一款開源模型,Stable diffusion的開發(fā)者Stability AI和RunwayML則認為既然開源,那么它也應該依此引用開源CC0協(xié)議,即版權(quán)歸公,同時任何人也可以自由地使用,包括商業(yè)使用。而對于DALL-E 2和Midjourney這樣并未開源的AIGC模型來說,生成內(nèi)容的權(quán)屬則相對模糊。
目前AIGC市場上也存在很多版權(quán)亂象,一些基于Stable Diffusion開發(fā)應用的廠商聲稱,使用自己AI程序生成的圖片版權(quán)歸自己,甚至依此生產(chǎn)NFT向使用者兜售。
對此,王渝偉認為,AI應用的使用者,在使用這種應用進行創(chuàng)作時,生成的圖片如果符合獨創(chuàng)性的要件,就能夠構(gòu)成《著作權(quán)法》上的作品。而廠商已明確告知了使用者著作權(quán)的歸屬問題,相當于在合同中已經(jīng)進行了約定,所以這種作品的著作權(quán)應當歸屬于廠商。并不是說AI應用基于開源模型開發(fā),它所生成的作品就不存在著作權(quán),還是應當根據(jù)《著作權(quán)法》的規(guī)定判定著作權(quán)歸屬。
“目前相關(guān)法律制定最大的障礙和阻力,可能是法律如何保持科技發(fā)展和倫理價值的平衡?!蓖跤鍌ヌ岢?,一方面,AI技術(shù)的高速發(fā)展,可能會與人類的基本倫理認知相違背,違反社會公序良俗;另一方面,法律的規(guī)制也不能對AI技術(shù)設置過于嚴苛的標準,影響AI的進一步發(fā)展。
作者:齊健;編輯:陳伊凡;出品:虎嗅科技組
來源公眾號:虎嗅APP(ID:huxiu_com),從思考,到創(chuàng)造
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @虎嗅 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
因為ai 的訓練數(shù)據(jù)來自人工