
YouTube首席執行官尼爾·莫漢(Neal Mohan)近日在接受媒體采訪時,就OpenAI旗下文本生成視頻AI模型Sora的訓練數據問題發表看法。莫漢雖然沒有直接證據表明OpenAI使用了YouTube視頻進行模型訓練,但他明確指出,這種行為若屬實,將違反YouTube的現行平臺服務條款。
莫漢強調,創作者在YouTube平臺上上傳視頻時,享有特定的權益和期望,其中包括對視頻內容的合理使用和保護。根據YouTube的服務條款,未經授權下載視頻或視頻片段用于其他目的,尤其是用于訓練AI模型,是明確禁止的。莫漢進一步表示,這種違規行為違背了創作者與YouTube之間建立的服務協議和信任關系。
值得注意的是,雖然莫漢對OpenAI的行為表示擔憂,但他也承認了YouTube的母公司谷歌在培訓自家AI模型Gemini時使用了YouTube上的內容。他強調,谷歌在使用這些內容之前,已經獲得了創作者的授權,并嚴格遵守了與創作者之間的合同協議。這一表態似乎也在暗示OpenAI在利用YouTube視頻進行模型訓練時,并未遵循類似的授權和合規流程。
OpenAI方面對于Sora模型的訓練數據來源一直保持較為模糊的態度。公司首席技術官Mira Murati在接受采訪時,對于是否使用了YouTube視頻作為訓練數據的問題并未給出明確答復,只是表示如果視頻是公開可用且合法的,那么可能會被納入訓練集,但她本人對此并不確定。
此次事件引發了關于AI模型訓練數據使用合規性的廣泛討論。隨著人工智能技術的快速發展,AI模型的訓練數據來源和使用方式成為業界關注的焦點。如何確保訓練數據的合法性、尊重創作者權益,以及遵循相關法規和行業規范,將是未來AI技術發展面臨的重要挑戰。
YouTube作為全球最大的視頻分享平臺之一,其對于內容版權和數據使用的態度具有廣泛的影響力。莫漢的表態無疑向業界傳遞了一個明確的信息:任何未經授權使用YouTube視頻進行AI模型訓練的行為,都將受到平臺的嚴厲打擊。
對于OpenAI而言,如何在追求技術創新的同時,確保合規使用訓練數據,將是其未來發展中需要認真考慮的問題。同時,這也提醒了其他AI企業和研究機構,在利用公開數據進行模型訓練時,必須尊重原始數據的版權和隱私,遵循相關法規和行業規范,以實現可持續和負責任的AI發展。
原創文章,作者:聆聽,如若轉載,請注明出處:http://www.bdzhitong.com/article/643793.html