飞象网 - 通信人每天必上的网站

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯網|會展
首頁 >> AI人性化 >> 正文

重磅!OpenAI首個視頻生成模型發布,1分鐘流暢高清,效果炸裂

2024年2月16日 10:46  每日經濟新聞  

據OpenAI官網,OpenAI首個視頻生成模型Sora發布,完美繼承DALL·E 3的畫質和遵循指令能力,能生成長達1分鐘的高清視頻。

AI想象中的龍年春節,紅旗招展人山人海。

有緊跟舞龍隊伍抬頭好奇官網的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行為。

一位時髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動感的城市標志。

一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險之旅,電影預告片呈現其穿梭于藍天白云與鹽湖沙漠之間的精彩瞬間,獨特的電影風格、采用35毫米膠片拍攝,色彩鮮艷。

豎屏超近景視角下,這只蜥蜴細節拉滿:

OpenAI表示,公司正在教授人工智能理解和模擬運動中的物理世界,目標是訓練出能夠幫助人們解決需要與現實世界互動的問題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長達一分鐘的視頻,同時保證視覺質量和符合用戶提示的要求。

如今,Sora正面向部分成員開放,以評估關鍵領域的潛在危害或風險。同時,OpenAI也邀請了一批視覺藝術家、設計師和電影制作人加入,期望獲得寶貴反饋,以推動模型進步,更好地助力創意工作者。OpenAI提前分享研究進展,旨在與OpenAI以外的人士合作并獲取反饋,讓公眾了解即將到來的AI技術新篇章。

Sora模型能夠生成包含多個角色、特定類型運動和主體及背景精確細節的復雜場景。該模型不僅能理解用戶在提示中所要求的內容,還能理解這些事物在現實世界中的存在方式。該模型對語言有深刻理解,能準確解讀提示,并生成表達豐富情感的引人入勝的角色。Sora還能在單個生成的視頻中創建多個鏡頭,使角色和視覺風格保持準確一致。

比如一大群紙飛機在樹林中飛過,Sora知道碰撞后會發生什么,并表現其中的光影變化。

一群紙飛機在茂密的叢林中翩翩起舞,在樹林中穿梭,就像候鳥一樣。

Sora還可以在單個視頻中創建多個鏡頭,并依靠對語言的深入理解準確地解釋提示詞,保留角色和視覺風格。

對于Sora當前存在的弱點,OpenAI也不避諱,模型在準確模擬復雜場景的物理特性方面可能會遇到困難,也可能無法理解具體的因果關系實例。例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數量會變化,一些憑空出現或消失。

此外,模型還可能會混淆提示的空間細節,例如左右不分,并且在處理隨時間發生的事件的精確描述方面也可能存在困難,比如跟蹤特定的攝像機軌跡。

如提示詞“籃球穿過籃筐然后爆炸”中,籃球沒有正確被籃筐阻擋。

技術方面,目前OpenAI透露的不多,簡單介紹如下:

Sora是一種擴散模型,從噪聲開始,能夠一次生成整個視頻或擴展視頻的長度,

關鍵之處在于一次生成多幀的預測,確保畫面主體即使暫時離開視野也能保持不變。

與GPT模型類似,Sora使用了Transformer架構,有很強的擴展性。

在數據方面,OpenAI將視頻和圖像表示為patch,類似于GPT中的token。

通過這種統一的數據表示方式,可以在比以前更廣泛的視覺數據上訓練模型,涵蓋不同的持續時間、分辨率和縱橫比。

Sora建立在過去對DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示詞技術,為視覺訓練數據生成高度描述性的標注,因此能夠更忠實地遵循用戶的文本指令。

除了能夠僅根據文本指令生成視頻之外,該模型還能夠獲取現有的靜態圖像并從中生成視頻,準確地讓圖像內容動起來并關注小細節。

該模型還可以獲取現有視頻并對其進行擴展或填充缺失的幀,請參閱技術論文了解更多信息(晚些時候發布)。

Sora是能夠理解和模擬現實世界的模型的基礎,OpenAI相信這一功能將成為實現AGI的重要里程碑。

每日經濟新聞綜合OpenAI官網

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部辛國斌:2023年全國行政村通5G覆蓋超過80%
精彩專題
CES 2024國際消費電子展
2023年信息通信產業盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
主站蜘蛛池模板: 成人纸尿裤,成人尿不湿,成人护理垫-山东康舜日用品有限公司 | 岩石钻裂机-液压凿岩机-劈裂机-挖改钻_湖南烈岩科技有限公司 | 涡街流量计_LUGB智能管道式高温防爆蒸汽温压补偿计量表-江苏凯铭仪表有限公司 | 无菌实验室规划装修设计-一体化实验室承包-北京洁净净化工程建设施工-北京航天科恩实验室装备工程技术有限公司 | 珠海冷却塔降噪维修_冷却塔改造报价_凉水塔风机维修厂家- 广东康明节能空调有限公司 | 游戏版号转让_游戏资质出售_游戏公司转让-【八九买卖网】 | 除湿机|工业除湿机|抽湿器|大型地下室车间仓库吊顶防爆除湿机|抽湿烘干房|新风除湿机|调温/降温除湿机|恒温恒湿机|加湿机-杭州川田电器有限公司 | 档案密集柜_手动密集柜_智能密集柜_内蒙古档案密集柜-盛隆柜业内蒙古密集柜直销中心 | 苹果售后维修点查询,苹果iPhone授权售后维修服务中心 – 修果网 拼装地板,悬浮地板厂家,悬浮式拼装运动地板-石家庄博超地板科技有限公司 | 安徽集装箱厂-合肥国彩钢结构板房工程有限公司| 网站建设-临朐爱采购-抖音运营-山东兆通网络科技 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | 泰国试管婴儿_泰国第三代试管婴儿_泰国试管婴儿费用/多少钱_孕泰来 | 上海平衡机-单面卧式动平衡机-万向节动平衡机-圈带动平衡机厂家-上海申岢动平衡机制造有限公司 | TTCMS自助建站_网站建设_自助建站_免费网站_免费建站_天天向上旗下品牌 | 立式_复合式_壁挂式智能化电伴热洗眼器-上海达傲洗眼器生产厂家 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 旋振筛|圆形摇摆筛|直线振动筛|滚筒筛|压榨机|河南天众机械设备有限公司 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 | 高考志愿规划师_高考规划师_高考培训师_高报师_升学规划师_高考志愿规划师培训认证机构「向阳生涯」 | 五轴加工中心_数控加工中心_铝型材加工中心-罗威斯 | 私人别墅家庭影院系统_家庭影院音响_家庭影院装修设计公司-邦牛影音 | 软文发布-新闻发布推广平台-代写文章-网络广告营销-自助发稿公司媒介星 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 断桥铝破碎机_发动机破碎机_杂铝破碎机厂家价格-皓星机械 | 自清洗过滤器,浅层砂过滤器,叠片过滤器厂家-新乡市宇清净化 | 法兰螺母 - 不锈钢螺母制造厂家 - 万千紧固件--螺母街 | FFU_空气初效|中效|高效过滤器_空调过滤网-广州梓净净化设备有限公司 | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 一级建造师培训_一建培训机构_中建云筑建造师培训网校 | 事迹材料_个人事迹名人励志故事 学生作文网_中小学生作文大全与写作指导 | 定制防伪标签_防伪标签印刷_防伪标签厂家-510品保防伪网 | 蓄电池在线监测系统|SF6在线监控泄露报警系统-武汉中电通电力设备有限公司 | 主题班会网 - 安全教育主题班会,各类主题班会PPT模板 | 钢结构-钢结构厂房-钢结构工程[江苏海逵钢构厂] | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 球磨机 选矿球磨机 棒磨机 浮选机 分级机 选矿设备厂家 | 深圳激光打标机_激光打标机_激光焊接机_激光切割机_同体激光打标机-深圳市创想激光科技有限公司 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 温湿度记录纸_圆盘_横河记录纸|霍尼韦尔记录仪-广州汤米斯机电设备有限公司 | 黑龙江京科脑康医院-哈尔滨精神病医院哪家好_哈尔滨精神科医院排名_黑龙江精神心理病专科医院 | 金库门,金库房,金库门厂家,金库门价格-河北特旺柜业有限公司 | 深圳品牌设计公司-LOGO设计公司-VI设计公司-未壳创意 |