7月25日,火山引擎2024“ai创新巡展”首站成都站透露了字节豆包大模型的最新进展:截至7月,豆包大模型日均tokens使用量已突破5000亿,平均每家企业客户日均tokens使用量较5月15日模型发布时期增长22倍。
豆包大模型由字节跳动自研,原名“云雀”,是国内首批通过算法备案的大模型之一,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。自发布之初,豆包大模型便主打使用量大、应用场景丰富。
据火山引擎副总裁张鑫介绍,在字节内部,有超过50多个业务在使用豆包大模型,覆盖了协同办公、数据分析、文案创作、辅助编程、内容审核、客服、游戏npc、角色对话、教育等各种场景,基于豆包大模型打造的新技术引擎正在加速业务创新;此外,豆包大模型的外部客户已覆盖手机、汽车、金融、消费、互娱等30多个行业,并联合oppo、vivo、荣耀、小米、三星、华硕等知名终端厂商和吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家汽车厂商分别成立了智能终端大模型联盟和汽车大模型生态联盟。
图说:火山引擎副总裁张鑫在2024“ai创新巡展”活动现场
本次活动中,作为豆包大模型西南区域的企业客户典型,蓝领招聘平台鱼泡科技和智能客服企业晓多科技也各自分享了接入豆包大模型实现业务增长的案例经验。其中,鱼泡科技的豆包大模型日均调用量已超1亿tokens,应用场景覆盖了岗位要求识别、工种识别、求职意向识别、推荐系统相似度识别等。
火山引擎大模型服务算法架构师孙帆指出,企业在使用大模型时,面临的关键挑战就是“模型效果”、“使用成本”和“落地难度”三个方面。豆包大模型和火山引擎正是从“更强模型”“更低价格”“更易落地”出发,帮企业解决难题。
据悉,豆包模型家族在5月正式发布时,提供的就是一个有多模态能力的模型家族,主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。主力模型豆包通用模型pro自5月发布以来,在多个公开评测集以及专业的第三方评测中表现出众,是得分最高的国产大模型。
本次,豆包模型家族升级了文生图模型和语音模型。升级后的豆包·文生图模型具备更精准的中英文长文本理解能力,能够生成图文一致的高美感图片;豆包·语音合成模型在升级后实现了智能识别文本情绪并对语速、语调动态调整,使之情绪更加饱满;声音复刻模型仅需5秒就能高保真复刻人声,并支持多种小语种。
值得一提的是,豆包模型家族此次官宣了一位新成员——豆包·图生图模型。基于文生图模型打造,豆包·图生图模型能实现高度还原人物特征,50多种风格场景自由转换,并提供多种富有创意的延展编辑。该模型能力已经在抖音、剪映、豆包、星绘等字节系app中落地,并通过火山引擎服务了三星、努比亚等企业客户,目前日均图生图数量达到数千万张。
在模型定价方面,公开报道显示,豆包主力模型的推理输入价格只有0.0008元/千tokens,比行业便宜99.3%。火山引擎总裁谭待此前接受采访时曾对此表示,大模型的超低定价,来自对技术的信心,火山引擎能通过技术手段实现大模型推理成本的优化。
“一个人现在创业,如果要花1万块钱调用大模型,可能会觉得有点贵。我们把价格降到1%都不到,100块钱就能用起来,他的想法也就更容易尝试。”谭待表示,企业的ai转型充满不确定性,试错成本要尽量低,才能更快更多地实现大模型的应用落地,从而让整个行业受益。”
除了效果好,价格便宜,豆包大模型还给出了最高可达同梯队模型数倍的每分钟处理tokens限额,让模型服务具备更强的承载力。
据孙帆介绍,豆包通用模型pro为客户提供了业内最高标准的初始tpm(每分钟tokens)和rpm(每分钟请求数),有助于企业的业务在高并发场景中落地。
目前,字节跳动还在持续加大对大模型技术研究的投入,近期在视觉、语音等方向有多项亮眼成果产出,其中,已有部分能力应用于豆包大模型相关产品中。
“我们希望用扎实的技术实力给客户更好的选择,帮助企业解除成本包袱,让客户更积极更大胆的尝试、迭代,让大模型应用大踏步向前。”孙帆说。
火山引擎还升级了头条、抖音同款插件服务,新增网页解析、计算器等插件,进一步扩宽模型能力的边界,支持企业多样的应用需求,同时带来了扣子专业版、hiagent平台等多款产品和云基础设施的最新进展。
张鑫表示,火山引擎在高速自我迭代,走向更加智能化、行业化和区域化。他说:“通过针对性的行业方案、产品和优化服务,相信在未来,会有更多西南区域的企业借助豆包大模型和火山引擎的力量,实现业务创新,从而为经济发展注入新的活力。”(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。