通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
【摘要】随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。
随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。
相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。
大模型成教育领域新变量
今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。
首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。
其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。
最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。
不同路线、不同思路
从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。
对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。
比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。
对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。
以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。
从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。
有道打响教育大模型应用第一枪
作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。
一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。
以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。
另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。
而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。
在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。
另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。
作为国内NLP能力领先的公司,有道多年来一直致力于基于Transformer模型的创新和应用,还积累了OCR、ASR、TTS、CAPT等几大核心技术,正是这些技术的有效整合,打开了新的想象空间,让有道成为国内率先将AIGC技术落地教育场景内的企业。
如今,有道正在多个业务场景推进“子曰”大模型应用落地,探索AI个性化教学的前沿阵地,将以技术创新和产品研发的优势,实现更广维度的突破(如有道纵横以及有道智慧体育等),为整个教育行业赋能。
产业需要探路先锋
在垂直大模型持续升温之下,包括京东、携程、网易有道等在内的厂商,已经开始扮演起“探路先锋”的角色,开始在零售、旅游和教育领域探索落地场景,并对产业发挥直接引领作用。
一来,当前大模型进展虽然激烈,但还处于初级阶段,属于垂直大模型的机会窗口尚未关闭,垂直厂商迫切需要利用自己掌握的高质量数据集,将数字化延伸到产业的“神经末梢”处,但其所面临的内外部挑战很大,因此各产业迫切需要破局者。
当前国内大模型这个赛道,依旧处于早期阶段,相比国外的GPT-4和Bard、LLaMA等厂商已经展开竞争来说,国内的通用大模型厂商尚未展开直接较量。在国内通用大模型还处于“懵懂”状态之下,国内的垂直大模型厂商也不存在太多的竞争,其依旧面临众多的机会。对于垂直大模型厂商而言,只需要紧跟潮流、精准解决用户痛点,就有机会脱颖而出。
当然,挑战同样存在。比如通用大模型厂商参与行业竞争,核心关卡突破面临挑战,数据安全问题需要解决等等,都需要有像携程、京东、网易有道,这样引领性的行业巨头参与其中,加速垂直大模型产业化的落地进程。
二来,从整个行业来说,无论是通用大模型还是垂直大模型,最终的商业化都需要落地产业,但如何将大模型能力与产业应用结合,从而创造出商业价值没有先例可循,同样需要一批探路者去开辟。前文提到,当前国内大模型无论是通用大模型还是垂直大模型,都还处于早期阶段,产业落地和技术商业化尚无先例可循。而不论是通用大模型还是垂直大模型,其商业化最终都指向产业和场景,因此诸如子曰大模型这样的垂直大模型落地,对于AI大模型产业化、商业化落地具有现实意义。
作为业内首个教育类垂直大模型,网易子曰大模型的发布,标志着教育领域的大模型开始进入实质应用阶段,其也或将引领全新的产业浪潮。而作为参与者与推动者,网易有道也将成为这场浪潮的受益者。