商汤,跑出中国AI的「超速度」

首页 > 观点 >正文

【摘要】「苟日新,日日新,又日新」,商汤用自己的实际行动,为我们完美地诠释了这一点。

  孟永辉 原创  ·  2024-07-06 13:43
商汤,跑出中国AI的「超速度」 - 金评媒
作者: 孟永辉   

0b427560e5d64ece8e69e5f21f38e38e.jpg

 

商汤正在用自己的实际行动演绎着「苟日新,日日新,又日新」的真正内涵,它发布的国内首个流式多模态交互大模型「日日新5.5」,便是明证。

你很难想象在短短两个月的时间内,商汤便有了如此巨大的进化。

要知道,早在两个月之前,商汤发布的「日日新5.0」,还是国内首个对标GPT-4 Turbo的国产大模型。

现在,商汤带着「日日新5.5」强势而来,再一次让我们看到了中国原创AI的「超速度」。

6000亿参数基模型性能全面提升。大量使用合成高阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显。

率先推出国内首个“所见即所得”模型「日日新 5o」,流式多模态交互,带来全新AI交互模式。

端侧模型全面升级,发布「日日新 5.5 Lite」,相比45.0版模型精度提升10%,推理效率提升15%,首包延迟降低40%

这些都是「日日新5.5」的主要更新点。透过这些更新,我们不仅看到了商汤大模型进化的超级速度,同样看到了它带领中国原创AI抵达了一个新的制高点。

如果对商汤「日日新SenseNova 5.5」进行定义的话,它是国内首个具备流式原生多模态交互能力大模型。

从两个月前的首个对标GPT-4 Turbo的国产大模型到现在国内首个在交互效果和多项核心指标实现对标GPT-4o,商汤再一次用实际行动演绎着AI的「超速度」。

致敬汤晓鸥,商汤给出「超速度」的底层答案

一切的进化,必然有一个原点;一切的表象,必然有一个答案。

如果一定要找到商汤跑出AI「超速度」的内在答案的话,其在AI的赛场上坚持长期主义,秉持耐心主义,凭借多年以来的技术积累和人才布局,坚守原创,或许是最关键的那一个。

正是因为如此,商汤在发布「日日新5.5」之前,商汤董事长兼CEO徐立用商汤「可控」人物视频生成大模型Vimi创作了一条视频,致敬商汤科技创始人汤晓鸥老师。

正如商汤董事长兼CEO徐立所说的那样,「如果没有商汤长期以来的技术积累和人才布局,或许就不会有今天的自己。」

或许,这才是商汤之所以会跑出AI的「超速度」的底层答案。

可以说,正是有了像汤晓鸥老师这样的商汤人在AI的赛道上,不断地坚持长期主义,不断地进行前瞻性地布局,今天的商汤才可以一次又一次的成为「首个」,并且演绎着中国原创AI的磅礴动能。

如果说,商汤的领军者们为它的发展指明了方向的话,那么,商汤本身的布局,则让它具备了一次又一次更新迭代的「硬实力」。

无论是从数据到算法、算力,还是从产品到行业、场景,商汤都在将AI的理想一步步照进现实。

海量的数据,强大的算法和算力,优质的产品体系和丰富的行业应用场景,成为了现在的商汤的真实写照。

此次商汤日日新大模型,再度进化,更是让我们看到了商汤的这些内在力量所外化出来的强大力量。

当我们站在这样一个基点去看待商汤的进化,当我们站在这样一个基点去寻找商汤「超速度」的答案,一切或许将会变得更加清晰而自然。

当我们站在这样一个基点去看待「日日新 5.5」的多模态能力,便会找到它在核心测试集指标上对标甚至超过GPT-4o的答案。

日日新5.5在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o

图片1.png

 

图片2.png


另外,「日日新5.5采用混合端云协同专家架构,最大限度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens高质量训练数据,包括大量合成的思维链数据,提升推理思维能力

显而易见的是,「日日新5.5」,正在成为新的技术基座。

同样地,正是有了「日日新 5.5」这样一个基座,商汤才有了在「日日新 5o」、「日日新Lite」上的卓越表现。

自然而流畅,商汤让AI所见即所得

AI大模型行业的发展进入到深水区,创新交互模式,让人们使用AI像使用互联网一样地简单和轻松,成为了引领行业发展的关键。

商汤为我们用实际行动演绎AI的「超速度」的一个明证,便是其在创新交互模式上领先。

通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,「日日新 5o」带来了实时的流式多模态AI交互体验。

使用感受如同人类自己交流一样直接,可以直接见你所见,理解你所需。

这种交互模式多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。

从场景理解分析、物体信息描述、书籍图文总结,甚至粗糙的简笔画、面部情绪,「日日新 5o」都能精准拿捏,丝滑交互,还能言语俏皮的与人做互动。

可以说,商汤「日日新 5o」带来的是相当丝滑且自然的交互体验,它真正让人们在使用AI的时候,如同和真人对话一样轻松和自然。

正是得益于商汤在创新交互模式上的领先,它让人们像使用互联网一样使用AI,变成了一个现实。

纵观当下的AI大模型市场,能够像商汤一样提供如此自然且流畅的体验的玩家,并不多。

商汤在现场的演示,为我们较为生动地展示了这一点。

从开始和工作人员俏皮地打招呼,到较为准确地判断出工作人员所在的场地,再到随便翻开一本书的任何一页,「日日新 5o」便可以给出好的理解和总结,而非简单意义上的识别。

可以说,商汤「日日新 5o」给我们带来的,不仅是实时和快速,还包含了日常生活当中的自然和流畅。

有了如此顺滑的体验,人们使用AI不再是一个门槛相对较高的事情,而是一件相当自然和平常的事情。只有有了如此好的交互体验,AI才能真正像扫码支付一样轻松和自然。

AI大模型市场的竞争进入到白热化,特别是当越来越多的玩家开始追求商业上的完美闭环的时候,商汤「日日新 5o」用自己出类拔萃的创新交互模式拔得头筹,再度向GPT-4o发起了强有力的挑战。

端侧模型再升级,商汤把价格打下来

AI大模型想要真正飞入到寻常百姓家,必然需要借助一个有一个的终端。

目前,商汤「日日新」端侧模型已深入各个行业,与超过150+客户启动商业对接,覆盖智能手机、平板电脑、VR一体机、车载电脑、智能台灯等诸多IoT设备部署应用。

现在,哪怕是一台智能台灯,同样可以与商汤AI大模型建立联系,实现协同。

这,其实得益于商汤推出的全面升级的端侧模型「日日新 5.5 Lite」。

它的性能指标更优,推理速度更快,端侧模型矩阵更完善。

「日日新 5.5 Lite」端侧大语言模型「商量SenseChat Lite-5.5」各维度全面升级,是目前综合性能最好的端侧模型。同时,配合端云模式,既保障性能,又保障速度

图片3.png

 

这,还不是最关键的。

商汤不仅实现了端侧模型的再度升级,同样还把端侧大模型的价格打了下来。

每台设备9.9/年的价格,让每一个用户,每一台设备都可以轻松享受到商汤AI大模型带来的丝滑体验。

随着商汤端侧模型的不断升级,它的产品同样开始变得丰富与完善。

从商量SenseChat到小浣熊,从拟人对话大模型到金融、农业、文旅和医疗的大场景,商汤已经建立了足够大的场景底座和足够丰富的应用场景。

很显然,如果没有商汤在端侧模型上的不断升级,那么,便不会有如此多的终端和场景可以落地。

在我看来,商汤用技术的不断进化和进步,进一步摧毁AI大模型的价格壁垒,让更多的人,更多的场景,可以享受到AI带来的普惠,才是真正导致这一切出现的关键。

从这样一个角度来看,商汤不仅跑出了技术进化的「超速度」,同样还跑出了行业和场景落地的「超速度」。

结语

「苟日新,日日新,又日新」,商汤用自己的实际行动,为我们完美地诠释了这一点。

当商汤一次又一次的「新」,汇聚在一起,于是,便产生了跑出「超速度」的强大能量,于是在短短两个月的时间内,便有了新一轮的进化。

对于商汤来讲,它,从国内首个对标GPT-4 Turbo的国产大模型,蜕变成为了国内首个对标GPT-4o的流式多模态交互大模型。

对于国内的AI大模型来讲,商汤展现着叫板国外AI大模型头部玩家的竞技者的姿态。

可以说,商汤的一小步,引领着国内AI大模型的一大步。

正是有了像商汤这样的中国原创AI的标杆性的存在,中国AI,才能在世界AI的舞台上,始终保持一席之地和话语权。

—完—

上一篇文章                  下一篇文章

孟永辉

孟永辉,资深撰稿人。微信公众号:menglaoshi007。i黑马、创业邦、亿欧网、投资界专栏作者。从事互联网10年,长期关注互联网研究。多篇文章在虎嗅、钛媒体、创业邦、亿欧网、i黑马、网易、新浪、搜狐等网站发表。

评论:
    . 点击排行
    . 随机阅读
    . 相关内容