责编:陈凯欣
2025-05-15
5月13日,字节跳动旗下火山引擎在上海举办大模型巡展活动,推出了一系列新型大模型产品。与以往注重大幅更新迭代不同,此次发布会更强调“小而专”和实用性的理念,同时推出了多款大模型工具。
从行业趋势来看,火山引擎的这一布局策略反映了当前科技巨头在AI领域的发展思路。一家接近字节跳动的消息人士指出,相比于追求一次性重大突破,“小步快跑”和“多线程并进”的发展模式更受重视。这种策略旨在确保产品能够快速适应市场需求,并找到可靠的商业应用场景。
在视频生成模型方面,火山引擎于发布会上推出了豆包视频生成模型Seedance 1.0 lite版。该模型支持从文本到视频、从图像到视频的转换,生成时长可选5秒和10秒,分辨率则提供480P和720P两种选择。
据火山引擎相关负责人介绍,尽管这款模型的参数规模较小,但在视频质量上仍能达到影视级水准,并且在生成速度上有显著提升。一位技术专家补充道,通过优化语义理解能力,现在可以更精确地控制人物表情和服装,同时对程度副词的理解与响应也得到了加强。
这些改进不仅降低了模型的推理成本,还旨在满足多个应用场景的需求。火山引擎希望这款大模型能在电商广告、娱乐特效、影视创作以及动态壁纸等领域发挥重要作用。现场有电商客户表示,利用相关大模型制作营销广告素材,能够有效降低制作成本和缩短周期。
发布会上,火山引擎还推出了另一款大模型——豆包1.5·视觉深度思考模型,同样遵循“实用至上”的设计理念。该模型仅有20B的激活参数,却在多模态理解和推理能力方面表现出色,在60个公开评测基准中,有38个达到了业内领先水平。
值得一提的是,豆包1.5·视觉深度思考模型新增了GUI Agent能力。借助强大的GUI定位性能,该模型能够在PC端和手机端等不同环境中完成复杂交互任务,例如对新开发的App功能进行自动化检测。
在企业级市场方面,火山引擎已经与多个行业实现了广泛落地合作,覆盖4亿终端设备、超过八成的主流车企、七成系统重要性银行及数十家证券基金公司、近七成C9顶级高校和100多家科研院所。
会上,火山引擎还介绍了Data Agent——一款面向企业级的数据全场景智能体。该产品具备主动思考、洞察、分析和行动能力,能够帮助企业挖掘数据资产价值,并覆盖数据分析和智能营销等多个关键领域。
“火山引擎自成立以来就坚持内外统一的服务原则”,火山引擎总裁谭待表示,“这种模式既保证了对内服务的高效性,也能够对外提供有力支持。”通过技术与资源的复用,火山引擎为客户提供高性价比的服务。
此外,字节跳动旗下的国内首款AI原生IDE产品Trae宣布完成升级。此次更新后,Trae将更加专注于企业端的垂类智能体开发,并为AI开发者提供更多便利工具。谭待曾表示,统一协议的应用能够有效降低开发成本、加速行业发展。
“我们内部使用Data Agent进行数据分析,Trae也在内部应用”,谭待在之前的采访中说道,“火山引擎的目标是成为AI原生和AI实践的典范,从而助力客户和开发者实现AI转型。”