OriginOS 4的大模型拉近了AI与用户的距离,让原本虚幻的人工智能走进更多普通百姓的生活。
我是首批内测用户,我的X90 Pro+更新OriginOS 4预览版有一阵子了。体验一番后,我发现小v助手(Jovi Copilot)的完成度远超我的想象。
手机端侧搭载大模型不是表面功夫,不是仅设置一个大模型的手机入口。而是将大模型与手机系统深度融合,在功能方面进行诸多尝试,力求让大模型能力应用于更多场景。
手机大模型与互联网公司大模型存在哪些区别?
近几个月,国内外大模型产品不断涌现。与手机大模型相比,各大互联网公司的明星AI可能更侧重于创意文案写作、信息整理、问答聊天和文章摘要等,主要应用于文字信息处理。而手机端大模型的用途不止于此,它更像我们理想中的AI,可充当私人智能助理,小到操控手机设备,大到提高生活和办公效率,实际应用场景更广,落地效果也更直观。

vivo大模型可不只是个普通聊天机器人。它与手机系统深度融合,让vivo等手机厂商把用户与AI间的路径优化到最短、最优。用户能直接用小v助手读屏,或在手机系统里查找目标文件,无需再上传到别的平台。而第三方AI大模型只是单纯调用接口,在效率和功能广泛性上,明显比不上vivo大模型。

我体验后发现,和国内互联网公司已发布的一些大模型相比,vivo大模型除可直接调用手机系统功能外,日常使用明显更方便。其他大模型要得到较好回答,需精心设计提示词(Prompt),而vivo大模型使用门槛更低,用日常生活中的交流方式就能得到不错的答复。

当然,若想取得更理想的效果,就有必要精心设计一下Prompt,关键是要包含任务目标背景描述输出要求这几个要点。
例如,这便是一个比较标准的提示(Prompt)。

在这个Prompt里,橙色部分为任务目标,绿色部分是背景描述,白色部分则为输出要求。我把这个Prompt输入小v助手后,就得到了这样一份Prompt指南。

小v助手给出的这个回答,其实已涵盖Prompt的大部分书写流程。其逻辑结构很科学,有不同评估方式与优化策略。要是依照这些步骤进行Prompt工程,确实能写出较好的Prompt,从而实现更理想的输出效果。
接下来,我们实际测试小v助手在不同场景下的能力吧。
我们先简单测试下目前大模型都能做的工作,例如生成工作周报。
开会前我们得提交周报,内容涵盖上周工作小结与下周工作计划。周会在周二开,有时忙起来就忘了写,这种时候就能让小v助手紧急写一份交上去。

我模拟了一个简单的周报需求,基本可依据用户信息生成标准格式的工作周报。令我惊喜的是,我只提及上周总结与下周规划,它却额外写出风险点,这能让领导看到我周报中对工作的思考与复盘,确实出乎我意料。
我们再来看看哪些大模型功能仅手机端可实现。
比如我手机里某个图片或文件忘了存哪,只要大概记得图片内容,跟小v助手描述一下就可以了。

往大了讲,这其实是对手机文件系统检索结构的重构。以前只是按时间或者人工来分类,现在就像有个对手机文件了如指掌的管理员。你要找文件时,哪怕忘了它的具体存放位置,只要大致记得内容,哪怕记忆很模糊,跟这个管理员说一声,AI就能帮你找到。
这是App端云端大模型做不到的。就算其他大模型具备该能力,也没有手机那么易用。它们肯定得上传所有图片、文件才能识别,先不说隐私安全。单就先上传再检索这一步骤而言,无论怎样都不会比在本地直接检索快。
大模型部署在手机本地后就能具备手机的系统级能力,像读屏、创建日程等。以前至少三步的操作,现在只需一步,即打开小v助手一键识屏。


但是其他一些大模型可能得复制出来自行保存命名才行,它会明确表示无法输出Word。理论上即便在App端也应该能做到,或许不像vivo考虑场景那般细致周到。
当然,大模型能力与手机功能相结合的玩法还可以更灵活。例如,拍了好看照片想发朋友圈却不知配什么文案时,小v助手能写好文案,还能打开微信并输入到朋友圈编辑框。

这可比单纯描述图片内容或者按图片生成文案有用多了。做自媒体的博主以后或许只需要拍图,然后把图交给手机大模型,文案创作、编辑都让AI来做,最后点个发布就可以了。
大部分国产大模型在App端无法上传图片,那我们就在网页端试试吧。

手机里的图片能进行风格化处理,经实际测试,这是真正由AI生成的。不像某些修图App,名义上是AI生成,实际只是加个滤镜,效果差远了。

并且,并非所有大模型都可支持图片风格化。
vivo大模型可实现众多功能与场景,我仅选取了几个较为实用、多数人可能会用到的功能来写。更多玩法就等大家更新OriginOS 4后自行探索吧,我觉得你们肯定比我更有创意。
OriginOS 4用了好些天了,我一直在思考,从功能机发展到智能机,手机系统日益智能,这有何意义?
这个问题我也问过小v助手了,它给出四点,我觉得挺有道理的。

但我认为这一切的意义对我们普通人而言,归根到底就是四个字:
科技造福大众。
消费级科技产品始终致力于让更多人体验到科技的乐趣。手机端部署大模型后,就步入了科技的银发时代。对于学习能力欠佳的老年人而言,这意味着手机上有了一位永远耐心、近乎无所不知的老师。
例如一位老人常常误操作,使手机调成静音模式,听不到电话铃音,又不知如何设置。给子女打电话询问时,可能也讲不清操作方法。不过有小v助手就不一样了,即便不会打字,也能切换手机铃声模式。

由此可见手机部署大模型具有包容性。在科技飞速发展的当下,我们往往会忽视那些跟不上时代的人,他们或许年事已高,或许学习能力因某些因素较差,又或许因身体障碍不能像我们一样自如使用科技产品。

不过我想讲的是,他们也有权接触并享用科技带来的便利。消费级科技产品始终致力于让更多人能够享受到新技术、新科技给生活增添的便利与乐趣。
得益于此,现在视障者能借助AI读屏软件上网,听障者可依靠AI生成字幕看电影,肢体有障碍的朋友也能通过语音识别与智能设备简单交互。

大模型部署于手机端后,这一切或许会更简便。
我认为这就是科技的价值所在。这些产品给弱势群体带来了科技的普惠,这不但使每个人都能体会到科技的乐趣,还为在生活泥沼中挣扎的人开辟了新径,弥合他们与科技的差距,让他们得以融入科技不断发展的时代。

手机大模型宛如一把钥匙,开启了弱势群体通向科技世界的大门。有了大模型,手机不再仅仅是通讯工具,更成了强大的万能工具与智能助手。像不会打字的老人,能借助语音输入表达需求,而深度学习与自然语言处理技术,让AI能理解并回应需求,甚至完成其中多数关键步骤。
OriginOS 4的发布仅仅是个开端。当前,vivo自研大模型更像是提供了一个平台,且开发了一些示范应用场景。要真正完善并扩充它,还需与更多开发者和用户共创,挖掘更多玩法,所以vivo将其开源了。

未来大家都在手机上使用大模型时,大模型真正的杀手级应用就会自然出现。

大模型与系统融合,虽不是手机厂商多年来最具颠覆性之举,但必然是历史大势,会成各厂商争夺焦点,还可能影响市场占比。未来,在大模型落地应用场景中能有何有意义的创新,就要看各家的本事了。
这是个创新和智慧的故事,讲述如何突破常规,开启新纪元。