字節跳動推出 Seedream 4.0 多模態創作模型

Back
Category : News

字節跳動推出咗Seedream 4.0多模態圖像創作模型,同Google嘅Nano Banana對決,生成速度快咗十倍,支援4K畫質。
就喺Google嘅Gemini 2.5 flash Image(Nano Banana)因為佢多模態輸入功能橫掃生圖模型嘅時候,而家中國嘅字節跳動都推出咗對應產品,正式發表最新一代圖像生成模型 Seedream 4.0。
Seedream 4.0 主打更靈活嘅多模態創作能力,支援圖文混合輸入,可以用嚟文生圖、圖生圖、圖像編輯同組圖生成等應用。今次更新唔止玩法更豐富,重大幅強化生成品質同推理能力,甚至將最高解析度提升至4K。
Seedream 4.0 支援高度彈性嘅圖文結合輸入模式,創作者可以透過文字生成圖像,都可以對圖片進行編輯,甚至一次處理多張圖片、或者讓圖片彼此結合嚟創作。
另外,喺風格化方面都顯著進化,由傳統嘅巴洛克藝術,到現代賽博龐克風格,都可以靈活切換,甚至混搭出全新嘅藝術視覺效果。
Seedream 4.0 最大嘅亮點之一,係佢喺邏輯理解同推理方面嘅能力提升。透過結合世界知識同上下文判斷,AI 喺處理如解謎題、續寫漫畫、時間同物理限制等任務時,可以先「思考」再「繪圖」,大幅強化創作嘅合理性同敘事性。
喺生成效能方面,Seedream 4.0 採用全新架構設計同優化嘅蒸餾技術,讓DiT模型嘅圖像生成速度比前代快上10倍以上。輸出嘅畫質都由過去嘅2K提升至支援4K超高解析度,同時開放自訂圖片尺寸,讓專業創作者更有彈性。
官方強調,Seedream 4.0 唔係單純圖像模型,而係整合各種生成同推理能力嘅「創意平台」,針對創作、專業應用同推理場景,提出八大應用範疇,未來可以延伸至更多領域,包括商業設計、視覺敘事、甚至教育同研究使用。TechBang