大模型兴起后,大量资源涌入,如今已形成百模大战。若不推出自家大模型,都难以自称是科技公司。竞争之激烈,可见一斑。
多数大模型通过输入对话框进行交互。我发现,不少用户仅停留在测试尝鲜阶段,提几个简单甚至无意义的问题后,就将模型束之高阁,未能深入挖掘其潜力。
将大模型装进手机,一切都变了。OriginOS 4中的小V助手表现证明,大模型已摆脱新奇玩具的定位,真正做到了实用与易用兼具。那么,它是如何实现的?
当前许多大模型应用主打宣传的功能涵盖文案创作、信息梳理、问答交互等,不一而足。
让我们一起看看几个实际应用场景:
我常帮人修手机,不是硬件问题,多因软件设置简单调整即可解决。
智能手机功能繁多,找特定设置很麻烦。上次我爸问,手机网络正常,也没欠费,但微信无法发送。这确实让人头疼。
别说中老年人对手机不熟悉,有时我们找个别设置也要花很久,像投屏功能,得翻遍菜单或上网查教程,再依步骤慢慢操作。

如今,只需将手机相册投屏到电视,与家人分享,无需繁琐操作。
在相册界面就能唤出小v助手,无需复杂指令,用口语化表达即可。比如问怎么把手机视频投到电视上,小v助手不仅提供操作步骤,还直接显示交互按钮,方便快捷。

生活中常遇到这种情况:财务索要上月出差发票时,你得退出微信,翻开相册查找发票照片,再返回微信发给财务。
或许有人会说,相册App也能搜索。确实,如今的相册具备一定的分类功能,如文档、植物、夕阳等,但这些仅限于特定类别,很多时候根本找不到你真正需要的内容。
OCR?相册搜索图片文字,比如发票,单搜发票会漏,因为有的叫票据,有的叫报销凭证,需多关键词查找。
需要发票时,在聊天界面唤起小助手,说在相册里找发票,即可完成操作。

发票不仅限于照片形式,也可能是PDF文件。现在无需在文件管理应用里慢慢查找,只需对小v助手说一声即可。同时,你可以用口语化表达添加筛选条件,例如找出特定时间内的XX文件。

这就是大模型的优势,它对内容和意图的理解更精准,还能解读图片的语义信息。比如,你想查找春节相关照片,它不会仅限于返回带有春字的图片,还会提供合影、灯笼、烟花、年夜饭等与春节记忆相关的多种结果。
你还能针对图片内容进一步操作,比如拍下校门口通知添加到日历,或提取海报地址信息进行导航。

路边遇到一只狗狗,不知是什么品种?可以直接询问小v助手。

搜索是获取信息的关键步骤。遇到问题时,我们打开搜索引擎,一页页浏览,找到合适内容后手动复制、切换窗口再粘贴。虽然流程不复杂,但中文互联网的内容质量良莠不齐,大部分时间其实都耗费在筛选有效信息上,效率大打折扣。
使用小v助手,能快速获取所需答案,支持连续追问,还可保存有用内容,方便又高效。

大模型常用于总结,尤其在阅读时,可快速提炼要点,生成简洁摘要,提升效率。

小V助手是一款具备联网搜索功能的大模型,直接提供链接即可了解内容,无需打开浏览器。它还支持直接总结文件内容,例如PDF,无需额外安装插件,比其他大模型更便捷实用。

当然,总结时可不断提问,包括细节和数据,这样能帮你快速掌握信息。
比如参加活动交换名片,会遇到这样的情景:
下周有个相关活动,需邀请这位朋友参加。于是找出名片,将其信息存入联系人,并在另一款App中起草消息内容(当然是找了网上的模板再修改)。编辑完成后,便发送给了对方。
一个人还好,邀请多人时,这项工作既枯燥又易出错。
如今借助小v助手,一句话即可完成多项操作,片识别、保存联系人和撰写邀请函。

如今社会,多数写作需求源于手机端。
比如收到甲方通过微信发来的改稿需求,学校老师布置的作业,或是需要重复处理的格式化工作。
即便用上了大模型,实际操作依旧繁琐:不停复制粘贴、切换应用,对创作而言,这种反复打断流程的方式极易干扰思路连贯性。
OriginOS 4做了哪些优化?
无论在哪种界面遇到写作需求,小v助手都能帮你完成。
比如领导让你通知开会,或大众点评写好评送饮料,都可唤起小v助手帮忙完成。

我们之前提到过,AI能力的发挥很大程度受制于提示词。同样的大模型,有人能运用得当,有人却可能用得像智障。
撰写Prompt时,可使用一个实用的方法论框架,名为『CRISPE』。
其中最实用且效果较好的方法是设定角色(CR)。例如,让AI为小学生做一场演讲时,如果直接使用像SVM、深度学习、神经网络这样的术语,显然不适合他们的认知水平。那么,怎样撰写一份合适的演讲稿?只需调整提示语,将问题从什么是AI改为假设你是一名小学教师,正在为10岁左右的孩子讲解什么是AI。这样,AI会以更生动、易懂的方式表达内容,从而取得更好的效果。
使用AI时,我们常频繁点击重新生成。其实,这一过程可通过优化提示词来实现。在输入提示词后,补充一句生成10个不同版本,即可一次性获得多样结果,大幅提高效率。这种方法简单高效,值得尝试。
目前,大模型使用中频繁的手指操作仍是复制粘贴。
信息来源多样,可能是文件、图片或聊天记录等,种类繁多。
假如同事发来一堆文件并安排了任务,为弄清具体内容,你需逐一打开文件,提取有效信息整理,并将相关任务添加到日历中,设置为日程提醒。
小v助手依托OriginOS 4,具备系统级识屏功能,可启用其后向服务。
简而言之,这个过程包括信息提取、意图识别和整理完成。

系统级应用如闹钟、日历,若需修改,可用自然语言直接操作,无需进入App设置调整。

这也是其他基于应用或网页的大模型难以实现的功能。
图片分享毫无疑问地成为了当代生活中不可或缺的重要组成部分。
如今AI绘图技术十分成熟,无需开启MJ或SD,直接用OriginOS 4即可完成,分享到朋友圈也更快一步。
得益于OriginOS 4的端侧运算能力,你的隐私将得到更好的保护。
曾经有一档热门节目网络迷踪,通过一张照片和有限线索,推断出拍摄地点,十分有趣。
很多人发朋友圈或微博时没留意,他人可能通过照片背景的建筑、车牌、路牌甚至树木种类判断你所在地。若打码,图片又失美感,怎么办?
OriginOS 4简单调整即可,更换图片风格就好。有些家长爱晒娃,这种方式不仅能保护孩子隐私,还能避免他人因丑照而尴尬,何乐不为?

思维导图是提升效率与激发灵感的工具,既能帮你理清思路,又能促进创意产生。
创作时有任何需求,先让小v助手梳理脉络,提供思路,助你明确方向,事半功倍。

不仅仅是参数对比,也不是模型基准评分。
更应重视的是可实际应用的能力,即以用户为本。
当前大模型存在一些实际应用中的问题:
对国内用户而言,某些大模型虽能力强,但网络访问受限的问题较为突出,这背后的原因无需多言。
有些国内大模型,虽网络无碍,但需将所有信息上传至云端处理,上云过程存在信息泄露风险。
针对这一问题,vivo提出端侧与云端相结合的双部署方案。关键敏感信息可选择不上云,同时小型模型能带来更优的功耗表现和更快的响应速度。若追求更高品质的内容,则可通过云端计算来实现。

OriginOS 4 不仅融入大模型,还借助AI力量,在底层算法上实现了进一步优化提升。

系统引入了虚拟显卡技术,这是一个独立的图形处理进程,能优先处理显示与图形任务,提升系统流畅度。同时,借助光线追踪、插帧和超分等图像算法,用户可享受更震撼的视觉效果。

此外,OriginOS 4在主系统之外打造了一个独立的「异构计算子系统」。该子系统具备独立的存储、显示与计算能力,构建起低功耗的运行环境。OriginOS 4会将主系统的部分计算任务分流至子系统处理,从而降低主系统的负载,提升整体效率。
主系统从而维持在较低负载状态,大幅提升手机续航。vivo通过优化虚拟显卡和异构计算子系统,实现了性能与功耗的最优平衡。这一创新为手机系统的性能、效率及续航提供了全新解决方案。
vivo开发者大会宣布:开源70亿参数蓝心大模型7B。

您可以在Github或Huggingface平台直接获取相关内容。

除了开源,vivo还发布全新开发者工具包,为开发者提供强大工具与接口支持。
不仅仅是让开发者开发插件,我觉得vivo正在努力构建一个全新的生态体系:
提供了大量数据集,助力开发者训练专属AI模型。开发者大会针对不同应用场景设立分会场,给予全面技术支持与社区资源,特别资助创新项目,这正是vivo生态共赢理念的具体展现。

未来的操作系统或许会基于大型预训练语言模型,构建出一个全新的生态体系。
通过构建超大规模参数的语言模型,操作系统将具备强大的自然语言处理能力,支持复杂语义推理和多模态任务协作。在这一生态中,操作系统将转型为智能助手,能够精准理解用户需求,提供个性化服务体验。
开发者可基于生态系统创造新应用,甚至大胆设想:App形态是否还将存在?

可以预见,基于大模型构建的新生态,将拥有广阔的发展空间。
OriginOS 4无疑迎来了一个良好的开端。