商汤,跑出中国AI的「超速度」
【摘要】「苟日新,日日新,又日新」,商汤用自己的实际行动,为我们完美地诠释了这一点。
商汤正在用自己的实际行动演绎着「苟日新,日日新,又日新」的真正内涵,它发布的国内首个流式多模态交互大模型「日日新5.5」,便是明证。
你很难想象在短短两个月的时间内,商汤便有了如此巨大的进化。
要知道,早在两个月之前,商汤发布的「日日新5.0」,还是国内首个对标GPT-4 Turbo的国产大模型。
现在,商汤带着「日日新5.5」强势而来,再一次让我们看到了中国原创AI的「超速度」。
6000亿参数基模型性能全面提升。大量使用合成高阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显。
率先推出国内首个“所见即所得”模型「日日新 5o」,流式多模态交互,带来全新AI交互模式。
端侧模型全面升级,发布「日日新 5.5 Lite」,相比4月5.0版模型精度提升10%,推理效率提升15%,首包延迟降低40%。
这些都是「日日新5.5」的主要更新点。透过这些更新,我们不仅看到了商汤大模型进化的超级速度,同样看到了它带领中国原创AI抵达了一个新的制高点。
如果对商汤「日日新SenseNova 5.5」进行定义的话,它是国内首个具备流式原生多模态交互能力大模型。
从两个月前的首个对标GPT-4 Turbo的国产大模型到现在国内首个在交互效果和多项核心指标实现对标GPT-4o,商汤再一次用实际行动演绎着AI的「超速度」。
致敬汤晓鸥,商汤给出「超速度」的底层答案
一切的进化,必然有一个原点;一切的表象,必然有一个答案。
如果一定要找到商汤跑出AI「超速度」的内在答案的话,其在AI的赛场上坚持长期主义,秉持耐心主义,凭借多年以来的技术积累和人才布局,坚守原创,或许是最关键的那一个。
正是因为如此,商汤在发布「日日新5.5」之前,商汤董事长兼CEO徐立用商汤「可控」人物视频生成大模型Vimi创作了一条视频,致敬商汤科技创始人汤晓鸥老师。
正如商汤董事长兼CEO徐立所说的那样,「如果没有商汤长期以来的技术积累和人才布局,或许就不会有今天的自己。」
或许,这才是商汤之所以会跑出AI的「超速度」的底层答案。
可以说,正是有了像汤晓鸥老师这样的商汤人在AI的赛道上,不断地坚持长期主义,不断地进行前瞻性地布局,今天的商汤才可以一次又一次的成为「首个」,并且演绎着中国原创AI的磅礴动能。
如果说,商汤的领军者们为它的发展指明了方向的话,那么,商汤本身的布局,则让它具备了一次又一次更新迭代的「硬实力」。
无论是从数据到算法、算力,还是从产品到行业、场景,商汤都在将AI的理想一步步照进现实。
海量的数据,强大的算法和算力,优质的产品体系和丰富的行业应用场景,成为了现在的商汤的真实写照。
此次商汤日日新大模型,再度进化,更是让我们看到了商汤的这些内在力量所外化出来的强大力量。
当我们站在这样一个基点去看待商汤的进化,当我们站在这样一个基点去寻找商汤「超速度」的答案,一切或许将会变得更加清晰而自然。
当我们站在这样一个基点去看待「日日新 5.5」的多模态能力,便会找到它在核心测试集指标上对标甚至超过GPT-4o的答案。
「日日新5.5」在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。
另外,「日日新5.5」采用混合端云协同专家架构,最大限度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens高质量训练数据,包括大量合成的思维链数据,提升推理思维能力。
显而易见的是,「日日新5.5」,正在成为新的技术基座。
同样地,正是有了「日日新 5.5」这样一个基座,商汤才有了在「日日新 5o」、「日日新Lite」上的卓越表现。
自然而流畅,商汤让AI所见即所得
当AI大模型行业的发展进入到深水区,创新交互模式,让人们使用AI像使用互联网一样地简单和轻松,成为了引领行业发展的关键。
商汤为我们用实际行动演绎AI的「超速度」的一个明证,便是其在创新交互模式上领先。
通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,「日日新 5o」带来了实时的流式多模态AI交互体验。
使用感受如同人类自己交流一样直接,可以直接见你所见,理解你所需。
这种交互模式多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。
从场景理解分析、物体信息描述、书籍图文总结,甚至粗糙的简笔画、面部情绪,「日日新 5o」都能精准拿捏,丝滑交互,还能言语俏皮的与人做互动。
可以说,商汤「日日新 5o」带来的是相当丝滑且自然的交互体验,它真正让人们在使用AI的时候,如同和真人对话一样轻松和自然。
正是得益于商汤在创新交互模式上的领先,它让人们像使用互联网一样使用AI,变成了一个现实。
纵观当下的AI大模型市场,能够像商汤一样提供如此自然且流畅的体验的玩家,并不多。
商汤在现场的演示,为我们较为生动地展示了这一点。
从开始和工作人员俏皮地打招呼,到较为准确地判断出工作人员所在的场地,再到随便翻开一本书的任何一页,「日日新 5o」便可以给出好的理解和总结,而非简单意义上的识别。
可以说,商汤「日日新 5o」给我们带来的,不仅是实时和快速,还包含了日常生活当中的自然和流畅。
有了如此顺滑的体验,人们使用AI不再是一个门槛相对较高的事情,而是一件相当自然和平常的事情。只有有了如此好的交互体验,AI才能真正像扫码支付一样轻松和自然。
当AI大模型市场的竞争进入到白热化,特别是当越来越多的玩家开始追求商业上的完美闭环的时候,商汤「日日新 5o」用自己出类拔萃的创新交互模式拔得头筹,再度向GPT-4o发起了强有力的挑战。
端侧模型再升级,商汤把价格打下来
AI大模型想要真正飞入到寻常百姓家,必然需要借助一个有一个的终端。
目前,商汤「日日新」端侧模型已深入各个行业,与超过150+客户启动商业对接,覆盖智能手机、平板电脑、VR一体机、车载电脑、智能台灯等诸多IoT设备部署应用。
现在,哪怕是一台智能台灯,同样可以与商汤AI大模型建立联系,实现协同。
这,其实得益于商汤推出的全面升级的端侧模型「日日新 5.5 Lite」。
它的性能指标更优,推理速度更快,端侧模型矩阵更完善。
「日日新 5.5 Lite」端侧大语言模型「商量SenseChat Lite-5.5」各维度全面升级,是目前综合性能最好的端侧模型。同时,配合端云模式,既保障性能,又保障速度。
这,还不是最关键的。
商汤不仅实现了端侧模型的再度升级,同样还把端侧大模型的价格打了下来。
每台设备9.9元/年的价格,让每一个用户,每一台设备都可以轻松享受到商汤AI大模型带来的丝滑体验。
随着商汤端侧模型的不断升级,它的产品同样开始变得丰富与完善。
从商量SenseChat到小浣熊,从拟人对话大模型到金融、农业、文旅和医疗的大场景,商汤已经建立了足够大的场景底座和足够丰富的应用场景。
很显然,如果没有商汤在端侧模型上的不断升级,那么,便不会有如此多的终端和场景可以落地。
在我看来,商汤用技术的不断进化和进步,进一步摧毁AI大模型的价格壁垒,让更多的人,更多的场景,可以享受到AI带来的普惠,才是真正导致这一切出现的关键。
从这样一个角度来看,商汤不仅跑出了技术进化的「超速度」,同样还跑出了行业和场景落地的「超速度」。
结语
「苟日新,日日新,又日新」,商汤用自己的实际行动,为我们完美地诠释了这一点。
当商汤一次又一次的「新」,汇聚在一起,于是,便产生了跑出「超速度」的强大能量,于是在短短两个月的时间内,便有了新一轮的进化。
对于商汤来讲,它,从国内首个对标GPT-4 Turbo的国产大模型,蜕变成为了国内首个对标GPT-4o的流式多模态交互大模型。
对于国内的AI大模型来讲,商汤展现着叫板国外AI大模型头部玩家的竞技者的姿态。
可以说,商汤的一小步,引领着国内AI大模型的一大步。
正是有了像商汤这样的中国原创AI的标杆性的存在,中国AI,才能在世界AI的舞台上,始终保持一席之地和话语权。
—完—