字節跳動推出 Seedream 4.0 多模態創作模型

字節跳動推出咗Seedream 4.0多模態圖像創作模型，同Google嘅Nano Banana對決，生成速度快咗十倍，支援4K畫質。
就喺Google嘅Gemini 2.5 flash Image（Nano Banana）因為佢多模態輸入功能橫掃生圖模型嘅時候，而家中國嘅字節跳動都推出咗對應產品，正式發表最新一代圖像生成模型 Seedream 4.0。
Seedream 4.0 主打更靈活嘅多模態創作能力，支援圖文混合輸入，可以用嚟文生圖、圖生圖、圖像編輯同組圖生成等應用。今次更新唔止玩法更豐富，重大幅強化生成品質同推理能力，甚至將最高解析度提升至4K。
Seedream 4.0 支援高度彈性嘅圖文結合輸入模式，創作者可以透過文字生成圖像，都可以對圖片進行編輯，甚至一次處理多張圖片、或者讓圖片彼此結合嚟創作。
另外，喺風格化方面都顯著進化，由傳統嘅巴洛克藝術，到現代賽博龐克風格，都可以靈活切換，甚至混搭出全新嘅藝術視覺效果。
Seedream 4.0 最大嘅亮點之一，係佢喺邏輯理解同推理方面嘅能力提升。透過結合世界知識同上下文判斷，AI 喺處理如解謎題、續寫漫畫、時間同物理限制等任務時，可以先「思考」再「繪圖」，大幅強化創作嘅合理性同敘事性。
喺生成效能方面，Seedream 4.0 採用全新架構設計同優化嘅蒸餾技術，讓DiT模型嘅圖像生成速度比前代快上10倍以上。輸出嘅畫質都由過去嘅2K提升至支援4K超高解析度，同時開放自訂圖片尺寸，讓專業創作者更有彈性。
官方強調，Seedream 4.0 唔係單純圖像模型，而係整合各種生成同推理能力嘅「創意平台」，針對創作、專業應用同推理場景，提出八大應用範疇，未來可以延伸至更多領域，包括商業設計、視覺敘事、甚至教育同研究使用。TechBang

Post Views: 1,506