<strike id="cy2gs"><menu id="cy2gs"></menu></strike>
  • <del id="cy2gs"><dfn id="cy2gs"></dfn></del>
  • AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略

    2024-6-7    鶴鶴

    一、項目背景
     
    AI動漫視頻是AIGC的熱門賽道之一,目前市面上許多動漫領域核心玩家均布局或已啟動AIGC動漫內容生產。我們希望為有意向進行AIGC領域創作的PUGC創作者提供便捷的渠道及工具,通過孵化一批獨家的AIGC動漫原創作者,入局動漫創作行業核心圈,為平臺供給大量差異化原創內容。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    1.行業洞察
     
    通過對AI動漫視頻行業進行深入調研洞察,我們發現其具有以下特點:
     
    •  
      隨著小說推文行業規模擴大,代理機構及推文KOC達人賬號迅速增長,AI動漫視頻訂單規模不斷擴張。
     
    •  
      在小說推文用戶群中,18-23歲的年輕人和女性用戶居多,著眼于抖音小說推文指數,用戶逐漸增加,且有逐漸“破圈”的趨勢。
     
    •  
      目前小說推文KOC達人的用戶畫像,集中在女性學生和寶媽群體,表明女性達人對于小說內容的理解更為透徹。
     
    2.用戶痛點
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    同時我們發現,目前用戶使用AI動漫視頻產品時的痛點主要集中在以下幾個方面:
     
    1)文本內容識別不準確
     
    畫面識別和文字匹配度不高,導致適配內容畫面表現出現偏差,影響視頻效果。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    2)圖像不受控制
     
    不能保證同一人物在不同分鏡下的妝造一致,同個人物的服飾、發型等會發生變化,影響畫面內容的連貫性。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    3)風格匹配度不高
     
    AI動漫視頻會存在較強的“機器感”,人物和場景風格未必和漫畫風格匹配。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    4)動態效果生硬
     
    AI動漫視頻終端交付內容動態不連貫,轉場效果很像PPT。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    3.設計理念
     
    基于此,我們對產品落地進行細致規劃,將模型驅動AI動漫視頻能力落地「度加」創作工具,跑通從文章識別到視頻合成的完整流程,確保基礎功能落地。從文本轉化、畫面控制、動態能力等多方面調優,對標高質量視頻要求,持續打磨工作流,支撐生態向高質量內容轉型。
     
    1)優質視頻內容促分發、提時長
     
    我們持續打磨設計工作流,力求使自動生產質量達到動漫視頻基線。
     
    2)高效工具建立內容創作優勢
     
    設計創新提升工具控制范圍和能力,保證輔助生產質量追齊專業動漫視頻水平。
     
     
    二、搭建視頻生成流程
     
    通過不斷打磨優化,我們搭建了一套完整的視頻生成流程:設置基礎信息及視頻參數→上傳文本→角色/場景提煉(可重新生成至符合預期)→生成旁白及分鏡(可進行編輯或重新生成至符合預期)→生成視頻。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
     
    三、聚類定制化風格模型
     
    1.七大類別模型選型
     
    為了使生成效果更加適配漫畫內容,解決風格匹配度不高的問題,我們對市面上的熱門漫畫題材進行了分析,根據其內容進行了分類梳理。共梳理出七大類別:都市現代、武俠仙俠、奇幻魔幻、恐怖懸疑、科幻賽博、末日廢土、兒童繪本。通過對類別內容的判斷,選擇能表現其內容特色的風格模型。
     
    為增加模型的可選擇性,每個類別下選擇2套模型進行適配,同時增加通用模型,保證內容品質及風格效果的全方面覆蓋。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    2.模型選型標準
     
    1)內容準確
     
    目前使用的底模均為基于Stable Diffusion 1.5底模訓練出來的模型。通用模型和垂直模型的區別在于,通用模型需要具備比較廣泛的通用的內容識別能力,盡可能覆蓋熱門題材。例如DarkSushiMix這個模型,在熱門的都市和仙俠等題材中,均可以識別小說分鏡描述的內容,生成符合預期的畫面,可以作為通用模型使用。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    2)風格契合
     
    垂直模型更具有針對性,部分小說內容具有強烈的特色風格,在模型選擇中,除了對于文本內容的識別,需要具備符合小說特色的風格效果。這時除了篩選適合的底模以外,還可以使用底模+LoRA模型的方式,一方面保證畫面識別,另一方面滿足風格需要。
     
    在進行了大量評測組合后,我們選擇出適合7大類別的模型搭配。例如在兒童繪本類別下,適配了童趣和國風兩種風格。通用的底模雖然可以將畫面內容呈現出來,但是風格上與兒童繪本差異較大,會導致觀感上與小說本身產生差異,模型適配準確后,就可以生成符合預期的畫面效果了。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    3)畫面美觀
     
    畫面美觀包含內容準確、風格契合、人物畫面無崩壞等多個方面。內容準確與風格契合在上面進行了總結,關于人物畫面的實現效果上,AI生圖在尺寸較小的情況下會出現部分Bug,主要受到影響的是面部清晰度。因此,我們選擇使用Adetailer插件進行面部修復,保證人物的清晰美觀。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
     
    四、多視角鏡頭控制畫面
     
    在工具初建階段,重點采用Prompt控制鏡頭視角的多樣性。我們測試了大量鏡頭視角描述詞在不同模型及內容描述下的效果,總結出5個效果識別顯著的詞匯:Close-up(特寫)、From below(仰視)、Top view(俯視)、Front view(正視角)、From side(側視角)。鏡頭視角描述詞根據策略隨機適配,避免連續出現相近視角的畫面,確保畫面構圖的豐富度。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
     
    五、多尺寸及轉場增強畫面豐富度
     
    1.規范制定
     
    我們制定了比例和尺寸兩方面的規范。
     
    •  
      比例設定:設定「16:9、9:16、4:3、3:4」4套生圖比例,選擇4個識別度高的字體匹配4套比例,滿足用戶對視頻橫板和豎版的不同要求。
     
    •  
      生圖及視頻尺寸:為保證較快的生圖速度,生圖過程中,先使用較小的生圖尺寸,再通過超分擴大圖片保證畫質清晰度,同時對畫面在視頻中的范圍及尺寸進行規范。以16:9為例,在該比例下,生圖尺寸若與視頻尺寸一致,畫面過長,AI生圖會出現相對不可控的情況。經過多輪測試評估發現,將畫面尺寸控制在4:3的范圍內效果最佳,16:9的高清視頻尺寸為1920x1080,所以畫面的部分生圖使用了684x512(4:3)的尺寸,再通過超分擴展為1440x1080(4:3)。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    2.運鏡轉場
     
    為避免視頻有類似PPT切換圖片的感受,增加運鏡和轉場,運鏡主要為上移、下移、放大,轉場設計了下滑、右滑、位移、旋轉等8個效果。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
     
    六、多音頻選擇提升臨場感
     
    1.基礎能力
     
    我們使用度加TTS旁白與端內音樂進行合成,音色及背景音樂提供多個種類選擇,音量、語速均可調整,保證音頻與畫面的最佳契合度。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    2. AI音視頻賦能內容生產
     
    Meta正式開源了一款名為AudioCraft的AI音頻和音樂生成工具,該工具可以直接從文本描述和參考音樂生成高質量的音頻和音樂。AudioCraft包含MusicGen、AudioGen和EnCodec三個模型,分別實現音樂生成、音頻生成和自定義音頻模型構建。我們不斷探索音頻模型的內容供給,規劃AI音效庫建立模式,為素材供給擴展可能性。
     
    AI動漫視頻工具1.0—探索全新內容創作設計理念與實現策略
     
     
     
    下面是我們1.0階段產出的視頻效果:
     
     
    Current Time 0:00
    /
    Duration Time 2:28
     
    Loaded: 0%
     
    Progress: 0.00%
    Playback Rate
    1.00x
     
     
    下期預告
     
    本篇內容主要為AI動漫視頻工具的基礎能力搭建,概述了我們在模型供給、畫面控制、規范制定、音頻合成等多個方面如何進行調優,以滿足產品功能。在未來的工具2.0迭代中,我們還將從文本轉化、畫面控制、動態生成能力等方面入手,全面提升視頻品質。此外,我們還會通過對多項AI能力的探索,衍生短劇、預告片生成能力,打造AI生視頻領域頭部產品。大家敬請期待吧~
     
    感謝閱讀,以上內容均由百度MEUX團隊原創設計,以及百度MEUX版權所有,轉載請注明出處,違者必究,謝謝您的合作。申請轉載授權后臺回復【轉載】。
     


    作者:百度MEUX
    鏈接:https://www.zcool.com.cn/article/ZMTYyMzY1Ng==.html
    來源:站酷
    著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。
     
     

    日歷

    鏈接

    個人資料

    藍藍設計的小編 http://m.skdbbs.com

    存檔

    主站蜘蛛池模板: 嫖妓丰满肥熟妇在线精品| 欧美精品亚洲精品日韩1818| 精品久久久久久中文字幕| 亚洲国产av无码精品| 91亚洲精品自在在线观看| 国产综合精品女在线观看| 日本精品视频在线观看| 亚洲国产精品自在在线观看| 久久精品国产亚洲AV无码麻豆| 久夜色精品国产一区二区三区| 成人久久精品一区二区三区| 奇米影视7777久久精品| 亚洲一级Av无码毛片久久精品| 精品无码人妻久久久久久| 亚洲国产精品热久久| 国产99re在线观看只有精品| 日韩精品久久久肉伦网站| 久久久人妻精品无码一区| 国产精品超碰12396| 精品国产一区二区三区免费| 精品欧洲av无码一区二区| 真实国产乱子伦精品视频| 午夜亚洲av永久无码精品| 精品无码人妻一区二区三区不卡| 9久热这里只有精品| 欧美韩国精品另类综合| 97视频在线观看这里只有精品| 久久棈精品久久久久久噜噜| 亚洲AV日韩精品久久久久久久| 亚洲精品人成无码中文毛片| 老司机精品影院91| 老子影院午夜精品无码| 精品日韩在线视频一区二区三区| 国产乱子伦精品无码专区| 国产精品久久久99| 国产精品亚洲产品一区二区三区 | 欧美日韩国产成人高清视频,欧美日韩在线精品一 | 亚洲国产精品无码久久| 中文字幕一区二区三区日韩精品| 亚洲精品亚洲人成在线观看下载| 自拍偷自拍亚洲精品情侣|