2022年,OpenAI聊天機器人ChatGPT的面世無疑成為了引領人工智能浪潮的標志性事件,宣告了新一輪科技革命的到來。無論是聊天娛樂、教育學習,還是工作生產、醫療健康等領域,人工智能正以前所未有的速度滲透到我們生活的方方面面。
而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。據了解,通過文本指令,Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。
這是繼文本、圖像之后,OpenAI將其先進的AI技術拓展到了視頻領域。Sora無疑是人工智能領域的一次重大突破,該技術不僅展示了AI在理解和創造復雜視覺內容方面的先進能力,而且對內容創作、娛樂和影視制作行業帶來了前所未有的挑戰和機遇。
對Sora問世的本源思考 我們知道,人類通過獲取和識別自然界和社會的各種信息來辨別物體,從而認知并改變世界。信息廣泛指人類社會傳播的各種內容,包括音訊、消息以及通訊系統傳輸和處理的對象。這些信息以多種載體形式存在,如文字、符號、表格、聲音、圖形圖像、視頻和動畫等。 然而,現在,Sora的出現意味著對現實世界的理解、模擬和生成不再局限于人類。它涵蓋了文字、圖形圖片、語音和視頻等形式,而過去這些只有人類才能完成。正因如此,Sora的問世預示著這個世界正在發生難以想象的變革。 大模型的核心技術:機器學習 大模型的核心技術是自然語言處理(NLP)和深度學習。具體而言,它基于Transformer架構,使用了大規模無監督學習方法,例如自回歸語言建模和掩碼語言建模,來訓練一個龐大的神經網絡模型。 機器學習聽起來很高大上,其本身也確實很復雜。為了將簡單問題復雜化,機器學習是模擬或實現人類的學習行為,如果我們從人類的學習行為來理解機器學習,也許就比較容易。 人在認識世界和學習的過程中,通常會先學習抽象的概念入手來了解某個事物或原理,這個概念其實就是對應機器學習的特征工程。比如我們在學習幾何指示的三角形,首先會從符號來認識,然后是了解三角形的定義、性質和計算公式。三角形的定義、性質和計算公式,對應機器學習的特征工程。 通常老師在講完課程后,會留一些課后作業和家庭作業,用以加深和鞏固學生對三角形的概念、定義、性質和計算公司的理解。那么學生做作業的過程,就是機器學習的訓練樣本。訓練數據是用來幫助機器學習知識、建立起蘊含知識的模型的數據。 為了更好地提升學習效果和學習成績,學生還會參加課外補習班,然后做各種刷題和模擬練習,這個過程就是讓機器學習的有更多的和更有效的訓練樣本。在每個學期中,學校通常都會安排周考、月考、期中考、期末考,用以檢驗學生的學習效果并作為考核的依據,最終的結果就是考上好的高中和好的大學。 學生參加各種考試就是對應機器學習的測試樣本。測試樣本是機器學習里模型服務的對象,對測試數據作出正確的預測和反饋,是機器學習一系列活動的最終目的。 我們看到,計算機世界所有的技術和手段,包括機器學習,都來源于我們現實日常生活和實踐,并且我們普通大眾都是能很好地理解。 很多時候父輩和祖輩們,可能他們沒讀過書,甚至不識字,但中華民族一些古老的知識和智慧(如成語、諺語)他們都能懂,甚至自然而然地去遵從。這些知識和智慧其實就是我們的基因,這些基因會一代代傳遞下來,并且不受文字和語言的限制。 這種基因的遺傳,其實也可以想象成一段“代碼”,假設這段代碼是更高維世界設計出來,那么人類也算是高維世界的“人工智能”。然后人類現又在自身的基因和日常實踐基礎上,設計出了第N+1代人工智能,并另類延續了人類的基因。 Sora會帶來哪些變局和顛覆性影響? Sora模式的提出,必將對未來的視頻制作模式產生巨大的影響,并為各行各業帶來新的機遇。但Sora帶來的影響,無論從寬度和深度來說,都將遠超這些。 1、對行業、職業的沖擊和顛覆 根據OpenAI官方文章介紹以及分享的演示視頻來看,Sora稱得上是“王炸級”的AI工具。就像OpenAI將圖像生成模型DALL-E集成到ChatGPT產品中那樣,如果OpenAI將視頻生成模型Sora也集成到ChatGPT供所有用戶使用,那么應該能夠對視頻相關的行業逐漸帶來改變,比如影視制作、短視頻創作、在線教育、廣告傳媒、游戲開發、直播,等等。 2、虛擬現實融合帶來的影響 Sora模式可以按照用戶的喜好和動作,在短時間內產生各種場景、情節,增強了用戶的互動體驗。sora的問世,當人沉浸在虛擬的元宇宙的時候,比如有AR、VR,當體驗做到極致的時候,可能會分不清哪個是現實、哪個是虛擬?;蛘咧绤s不愿意區分,就像人做了美夢不愿意醒來一樣,因為虛擬世界過的可能會比現實世界更好。 3、數實融合驅動精神境界提升 隨著數字技術發展,人類社會活動的一切過程都有可能被記錄下來,形成數據。sora的出現,未來可以依據價值體(如組織、企業、個人、群體的標簽畫像、行為為記錄,可以方便地生成和還原完整現實世界的一切原始模型和軌跡。 也就是說,可能不需要查看攝像頭視頻,或需要畫像專家依據目擊者的描述來勾勒嫌犯的畫像,就可能直接生成相關的視頻(不只是靜態畫面)。因此,未來,你擁有多少財富、物資和房產,在平臺里都是透明的,你所花的任何一筆錢,其實也是透明的. 這個可能導致的結果,隨便一筆花費別人都知道。如果是來路不正的錢,可能都不會有機會花費,違法犯罪行為也更都無法隱藏。所以,數字技術的發展,會驅使人們提升精神和道德的修養,使得人們可能會更多地從物質層面的追求,轉向精神層面的追求和探索。 Sora只是小試牛刀,它展現的不僅僅是一個視頻制作的能力,而是大模型對真實世界有了理解和模擬之后,會對整個人類社會全方位帶來新的突破和變革。 結語 中國人常說:“六六大順、逢七必變”這句話。對于數字“七”包含著許多奧妙,例如7日來復,一周有7天,7年之癢,公司7年一個坎,個人職業往往7年會有起落等等。 二十一世紀有三個7,,一個“七”已經讓人頭痛,兩個“七”更加復雜,3個代表“多”,很多事情都可能要變,二十一世紀會是非常快速的一個時期。因此,如果再拿二十世紀的思維,有可能是行不通。比如在數字化時代,我們可以彎道超車和選擇新的路徑,而簡單地照搬西方的思想和管理模式可能行不通。當然,這并不意味著我們之前學習和西方學習沒有必要,相反,之前的學習是非常有必要的。 Sora的出現是人類AI技術新的里程碑,我們在AI上暫時落后于美國,但任何事情有好有壞,AI對人類的沖擊和顛覆的后果還未最終驗證。有一種觀點,認為所有的創造發明其實都是發現,即讓人們在合適的時間“發現”,在我們發現這些規律和科學奧秘之前,它們本就一直存在和起作用。 道德經:“天網恢恢,疏而不失(漏)”,如果“天網”看成是一個看不見、摸不著的高維“數字系統”,天網和現實世界的對接和映射,并將現實世界的萬事萬物進行了記錄和存檔。Sora的問世讓現實世界和數字世界連接和孿生趨向無縫連接和融合,那么天網系統、現實世界和數字世界三者的相互作用,又將會進一步給我們的未來帶來更多的變化。01
02
03
04
(審核編輯: 智匯lucy)
分享