第一av在线_日韩成人久久久_亚洲人成电影网站色_精品精品导航_亚洲综合中文_精品国产91久久久久久_可以在线观看的黄色_99热这里有精品

每日熱文:谷歌更新隱私政策,大模型“諸神之戰”背后的訓練數據隱憂
2023-07-05 20:56:54 來源:21世紀經濟報道 編輯:

21世紀經濟報道記者王俊 南方財經全媒體記者馮戀閣 實習生羅洛 北京、廣州報道“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓練Google的人工智能模型。”近日,谷歌更新隱私政策,表示將利用網絡公開數據訓練旗下的AI模型,相關條款已于7月1日生效。

谷歌的這一動作引發爭議,單方面通知用戶的行為是否合法合規?此舉又是否有“囤數據”之嫌?

此前,Twitter和社交網站Reddit已經采取措施,限制第三方對其API的訪問。國外科技公司的一系列舉措背后,可能是大模型發展路上一個不可忽視的真相:訓練數據的重要性愈發顯現。隨著大模型產業的快速發展,出于市場競爭的需要,模型規模將快速膨脹,但同時可用于訓練的數據供給相對不足,且未來日趨稀缺。


(相關資料圖)

未來,數據或將成為AI發展的“兵家必爭之地”。

“囤數據”訓練AI模型

近日,谷歌更新隱私政策,表示將利用網絡公開數據訓練旗下的AI模型。在隱私協議的“可公開獲取的資源”一欄,谷歌提到:“我們可能會收集公開的在線信息或來自其他公共來源的信息,幫助訓練Google的人工智能模型。”該大模型將會為谷歌翻譯、谷歌旗下聊天機器人產品“Bard”及Cloud AI等產品和功能提供助力。

對比去年年底發布的上一版隱私政策,谷歌將“收集信息以幫助訓練語言模型”的相關措辭更改為“訓練人工智能模型”,并新增明確了自家AI產品對于數據的使用權利。這似乎意味著,谷歌在訓練旗下聊天機器人及其他AI模型,或未來開發AI產品的過程中,有權使用人們在網上公開發布的任意內容。

南方財經全媒體記者在檢索后發現,7月5日,谷歌中文版隱私政策也已經進行同步更新。

在競天公誠律師事務所合伙人袁立志看來,此次谷歌隱私政策的更新從實踐角度看不算重大變化。“無論在我國還是域外,對公開數據的正常收集和使用,在一般情況下不算違法。”不過他補充道,如果個人通過發送郵件等方式向信息處理者就相關使用表露明確拒絕,對其個人信息的收集和使用就應當停止。

北京大成律師事務所高級合伙人鄧志松也表示,就目前可獲得的信息而言,谷歌對收集與處理用戶個人信息的范圍和目的作出了詳細說明,即使以歐盟GDPR項下更為嚴格的“告知-同意”規則為標準,谷歌的這一收集與處理行為至少在形式上具有合法性。至于其實施過程中可能涉及的實質合法性判斷,及由此可能對AI等行業產生的影響,則尚待進一步觀察。

雖然此次更新并未對個人信息保護帶來影響,但暗藏背后的數據隱憂卻逐漸被公眾注意到。

“得數據者得天下”

數據是數字經濟時代的“新石油”,處在時代中的人工智能技術亦受其影響。

以OpenAI的幾代GPT模型為例,訓練數據上,GPT-1預訓練數據量僅有5GB;到了GPT-2,這個數據則增加至40GB;而在GPT3模型下,OpenAI用以訓練模型的數據集數據量達到了驚人的45TB。

“大模型時代,得數據者得天下。”對外經濟貿易大學數字經濟與法律創新研究中心執行主任張欣指出,一方面,訓練數據是大模型訓練的基石和燃料,如果沒有數據,大模型的訓練就無法開展和持續;另一方面,當前技術領域的研究顯示,各家大模型在算法層區別并不大,并且具有同質化的趨勢。在此背景下,訓練數據就成了真正區分且影響大模型性能的重要因素之一。

需求漸長,供給端卻并未馬上配合。目前,有多家處在“數據提供端”的公司對數據抓取、開源等做出了反應。比如Twitter限制了用戶每天能查看的推文數量,幾乎使數據提供服務無法使用。馬斯克表示,這是對“數據抓取”和“系統操縱”的必要反應。

今年1月,圖庫網站Getty Images對AI圖像生成器研發公司Stability AI提起法律訴訟,指其非法復制和處理版權圖像作為模型訓練數據。4月,環球音樂集團發函要求Spotify等音樂流媒體平臺切斷AI公司的訪問權限,以阻止其版權歌曲被用于訓練模型和生成音樂。

同樣在4月,Reddit官方宣布將對調用其API的公司收費,原因正是OpenAI、谷歌等公司利用該平臺上的數據訓練模型。此外,IT技術問答網站Stack Overflow也計劃向AI大模型的開發者及公司收取數據訪問費用。

6月,中文在線、同方知網與中國工人出版社等國內25家文化出版機構發出共同倡議,強調“為人工智能學習模型提供可靠、穩定、安全的內容來源”等AIGC版權保護問題的重要性。

科技公司的系列動作,一定程度反映了數據的重要性。

在7月2日全球數字經濟大會人工智能高峰論壇上,昆侖萬維科技股份有限公司CEO方漢表示,高質量數據對大模型發展至關重要。

“坦白地講,最近三年的大模型訓練積累的是對豐富的預訓練數據深度加工的能力。OpenAI所有公開的論文和講演,對訓練過程和訓練算法都是公開的,但其從不公開模型結構及數據處理。”方漢指出,目前全世界大模型預訓練團隊都試圖重現OpenAI在模型架構的動作以及預訓練數據的動作,任何一家企業的預訓練數據加工能力都至關重要。

數據稀缺、分散難題何解?

數據的重要性不言而喻,高質量數據更是稀缺品。

早在去年,一項來自Epoch Al Research團隊的研究就揭示了一個殘酷的事實:模型還要繼續做大,但數據卻不夠用了。研究結果表明,高質量的語言數據存量將在2026年耗盡,低質量的語言數據和圖像數據的存量則分別在2030年至2050年、2030年至2060年枯竭。

這意味著如果數據效率沒有顯著提高或沒有新的數據源可用,那么到2040年,模型的規模增長將放緩。

百舸爭流是市場競爭的常態,但過分競爭也有可能為行業帶來災難。限制數據抓取,很可能導致新一輪的數據大戰,進而引發平臺之間屏蔽、數據壟斷等問題。

國際標準化組織TC/154技術專家王翔指出,大模型的蓬勃發展對訓練數據提出了很高的數量和質量要求。在供給側,人口增速、用網時間下降、制度性地理約束提高、高質量數據匱乏等都在制約大模型未來發展,SOP化和轉發習慣也降低了供給能力;在需求側,無論是主觀治理思路還是客觀基礎設施條件,以及大型語言模型所有者應對市場的考量,都會持續強化數據壟斷。

此外,大模型訓練中,面對的高質量數據的稀缺、行業數據分散等問題應如何解決?

受訪專家指出,未來健康的生態需要市場側和監管側等多方的共同建設維護。

“首先還是需要相信市場的力量”,袁立志指出,隨著優質數據的需求逐漸顯現,各個市場主體都會被“無形的手”推動向前。“數據資源的尋找、匯聚、清洗、標注等各個環節預計都會因競爭的活躍而不斷改善,以滿足市場需求。”他表示。

張欣則具體指出,目前行業內的開源數據集正在不斷增多,未來應呼吁更多人工智能企業、從業者加入,建立更加良好的行業生態。“人工智能訓練時的眾包思路也非常重要。”她認為,企業之外,還可以善用技術社群的力量提升并開拓更多的高質量數據集。

而監管側,在張欣看來,從法律法規層面明確訓練數據集的合法性獲取路徑是監管下一步應當關注的重點。“只有明確了合法獲取的路徑,大模型訓練者才有更穩定的合規預期以開展工作。”

袁立志認為,監管側數據要素市場的建設深入會為大模型領域的發展帶來良性影響。“數據要素市場建設走深意味著數據流通利用全流程提速提效,自然也惠及大模型的訓練數據收集。”

關鍵詞:

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網 - 環球資訊網 - 環球生活門戶"或電頭為"環球傳媒網 - 環球資訊網 - 環球生活門戶"的稿件,均為環球傳媒網 - 環球資訊網 - 環球生活門戶獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網 - 環球資訊網 - 環球生活門戶",并保留"環球傳媒網 - 環球資訊網 - 環球生活門戶"的電頭。

brazzers在线观看| 91麻豆精品国产自产在线| 婷婷亚洲精品| 中国日本在线视频中文字幕| 亚洲国内高清视频| 欧美va亚洲va国产综合| 欧美激情一区二区在线| 台湾色综合娱乐中文网| 国产精品丝袜在线播放| 老司机免费视频久久 | 91精品啪在线观看国产81旧版| 伊人久久大香| 欧美精品密入口播放| 欧美一区二区福利视频| 亚洲欧美国产精品久久久久久久 | 红桃成人av在线播放| www视频在线观看免费| 欧美日韩精品在线视频| 久久er99精品| 亚洲精品亚洲人成在线| 欧美性爽视频| 能在线观看av网站| 欧美在线不卡视频| 国产欧美一区二区三区在线看蜜臀 | 高清日韩中文字幕| 青青草原av在线| 亚洲日本中文字幕| 欧洲国内综合视频| 综合久久国产九一剧情麻豆| 欧美成人久久| 任你躁在线精品免费| 国产精品久久久久久久久久齐齐 | 亚洲高清资源| 亚洲男人都懂第一日本| 一级黄色在线| 欧美一二三区在线观看| 一二三区在线| 91久色porny| 欧美精品一线| 亚洲精品乱码| 老牛嫩草一区二区三区日本| 日韩一区精品视频| 丰满放荡岳乱妇91ww| 成人午夜精品一区二区三区| 成人免费视频一区二区| 粉嫩av一区二区三区粉嫩| 久久综合色婷婷| 亚洲一区在线电影| 欧美视频一区二区三区在线观看| 91精品在线免费观看| 亚洲免费成人av电影| aa国产成人| 久久久久久9| 91亚洲天堂| h视频在线免费| 在线视频1区| 精品51国产黑色丝袜高跟鞋| 美女免费免费看网站| 日本一区视频| 在线免费观看的av| 99色在线观看| 国产午夜精品一区在线观看 | 图片婷婷一区| 欧美三区美女| 久久人人97超碰国产公开结果| 久久夜色精品| 老司机一区二区| 国产精品久久免费看| 欧美日韩激情小视频| 精品国产一区二区三区不卡 | 国产一区二区三区不卡av| 四虎国产精品免费观看| 在线日韩欧美| 久久久久久久久久看片| 精品久久久久久久久久久久| 欧美亚洲图片小说| 亚洲女人视频| 国产91欧美| 在线日韩欧美| 中文一区二区在线观看| 欧美日韩一区二区在线观看视频| 初尝黑人巨炮波多野结衣电影| 少妇视频在线| 国产精品久久久久久影院8一贰佰| 久久国产精品99精品国产| 亚洲女同ⅹxx女同tv| 亚洲男人的天堂在线播放| 国产尤物视频在线| 国产www视频在线观看| 婷婷亚洲五月色综合| 日本不卡高清视频| 亚洲精品一卡二卡| 免费特级黄毛片| 欧美成人三级| 亚洲天天影视网| 中文字幕高清不卡| 亚洲激情久久久| 日韩激情电影| 国模大胆一区二区三区| 极品美女销魂一区二区三区免费| 亚洲激情在线播放| 九一在线视频| 欧美gay男男猛男无套| 国产欧美日韩麻豆91| av二区三区| 免费看久久久| 国产精品国产精品国产专区不蜜 | 久久久精品天堂| 欧美mv日韩mv国产网站app| av手机免费在线观看| 日日夜夜天天综合| 亚洲欧美久久久| 欧美揉bbbbb揉bbbbb| 国产精品高颜值在线观看| 国产精品尤物| 欧美日产国产精品| 欧美精选视频一区二区| 美国三级日本三级久久99| 欧美草草影院在线视频| 国产精品视屏| 亚洲制服丝袜在线| 国产三线在线| 蜜臀av性久久久久蜜臀aⅴ四虎| 亚洲国产三级网| 66视频精品| 亚洲码国产岛国毛片在线| 幼a在线观看| 久久国产精品99久久久久久老狼| 亚洲男人天堂2023| 久久久久美女| 亚洲国产精品久久| 国产欧美日韩| 在线精品亚洲一区二区不卡| 国内精品久久久久久野外| 国产成人精品在线看| 精精国产xxxx视频在线| 丰满少妇久久久久久久| 在线h片观看| 久久精品一二三| 三级中文字幕在线观看| 91色porny在线视频| 性感美女一区二区在线观看| 自拍偷拍欧美激情| 亚洲国产高清在线观看| 亚洲网友自拍偷拍| **国产精品| 亚洲一区二区成人在线观看| 国产精品一区三区在线观看| 色琪琪一区二区三区亚洲区| 少妇久久久久| 欧美白嫩的18sex少妇| 日韩av电影天堂| av网站导航在线观看免费| 国产综合色精品一区二区三区| 五月香视频在线观看| 91在线小视频| 亚洲男女网站| 欧美一级高清片| 亚洲成人免费| 国产一区精品| 国产精品乱码妇女bbbb| 91丨精品丨国产| 亚洲老头老太hd| 国产亚洲一区二区三区| 欧美极品中文字幕| 成人黄色免费| 白白色亚洲国产精品| 香蕉久久精品日日躁夜夜躁| 一二三四社区在线视频| 99re热视频这里只精品| 999精品视频在线观看| 亚洲成年人在线| 亚洲激情女人| 偷拍自拍在线看| 亚洲欧美中文日韩在线v日本| 99国内精品久久| 欧美猛男同性videos| 国产在线视频网址| 亚洲综合图片区| 蜜桃视频免费观看一区| 99爱在线视频| 精品动漫一区二区三区在线观看| 91丨九色porny丨蝌蚪| 日韩激情一区| 深夜福利在线看| 91电影在线观看| 日韩专区一卡二卡| 亚洲女娇小黑人粗硬| av福利精品| 欧美三级韩国三级日本一级| 成人一区二区在线观看| 欧美有码在线| 欧美xxxx做受欧美护士| 在线看片你懂得| 欧美成人欧美edvon| 中文字幕在线播放不卡一区| 国产一区在线不卡| 亚洲国产mv| 亚洲图片在线| 欧美粗暴jizz性欧美20|