模态图像

实现GPT4o图像生成编辑能力BFL推出新一代多模态图像生成与编辑

只能通过文字控制，无法灵活结合图片作为上下文；无法连续编辑或保留角色特征，缺乏“认知连续性”；局部编辑需要复杂遮罩或 finetuning；多轮操作后常常图像退化（失真、风格丢失）；编辑速度慢，无法满足实时交互需求。

我们来看看昨日大模型相关的一些进展，有几个点比较有趣。 1、使用LLM进行标书写作简单开源项目及openai O1实现思路再索引，https://mp.weixin.qq.com/s/jP00sy_wicIJ1wPSafskIA，https://github.