豆包1.5字节发布深度思维模式:生成“实拍级”图像

研发家 | 2025-04-17 28

4月17日,据报道,今天,字节跳动火山引擎总裁谭待正式发布了备受关注的豆包1.5深度思维模式,在火山引擎AI创新巡展杭州站现场。

谭待指出,豆包1.5深度思维模式在许多关键领域表现出突出的表现。在数学、编程、科学推理等专业领域,能够准确高效地处理复杂问题;它在创造性写作和其他一般任务方面也表现良好。

该模型采用MoE架构,总参数为200B,激活参数为20B ,与行业内类似模型相比,其参数规模减少了50%,这使得其在推理成本方面具有显著优势,可以以较低的成本实现更有效的推理计算。

豆包1.5深度思维模型进一步拓展了功能边界,将视觉理解融入其中,解锁了许多基本功能。例如,它可以根据照片准确分析地形特征;当人们旅行时,帮助他们做出订购决策;在公司的办公场景中,它有助于完成项目管理流程图的绘制,为用户带来更加多样化和便捷的服务体验。

与此同时,火山引擎还大幅升级了豆包生成图模型,并推出了3.0版本。新版本在文本排版方面更加精致,图片生成能力更加精细。它还增加了2K照片直接输出功能,大大提高了图片生成的质量和效率,为用户带来了高质量的视觉内容创作体验。

新模型还具有较强的视频搜索能力,模型可以根据用户搜索视频中的问题找到相应的答案。

此外,谭待表示,豆袋大型模型的使用继续快速增长。截至2025年3月,豆袋大型模型的平均日使用量超过12.7万亿,是发布之初的106倍以上。

赞一个

分享:
打开微信扫一扫
21
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版无忧
投稿无忧
翻译服务
润色服务
自助查重
排版校对
科研绘图