当AI逐步渗透到生活的方方面面,AI正持续向端侧靠近,从手机都电脑再到汽车等产业都将迎来转折。
浙商证券在研报中指出,生成式AI发展之初,由于计算规模巨大,运算处理基本都汇集在云端进行,如今为了提升用户的体验,AI能力需要落地到数十亿终端设备,成本必将大幅提升,因此,AI处理重心正不断向边缘转移,混合AI成大势所趋,多家科技巨头“盯上”各类端侧AI应用,已竞相布局。
浙商证券称,AI不止于云,端侧是模型应用不容忽视的重要场景,从概念来看,云侧AI是指,在数据云端汇集训练,模型通用性强。从终端采集和感知到的声音、视频等数据都通过网络传输到云中心侧进行后续处理。
而端侧AI则是终端设备上进行的轻型模型运用。更多AI计算和推理工作负载在手机、笔记本电脑、XR 头显、汽车和其他边缘终端上运行。随着用户对生成式AI应用需求日益增长,端侧AI的隐私和安全、低延时、可靠性、低成本等技术优势凸显。
那么,当前端侧AI已发展到哪一步了,未来又会有哪些进展?
AI PC:产业落地转折点渐行渐近
浙商证券指出,由于PC已经有成熟的消费市场,AI PC已接近产业落地的转折点。支持人工智能的PC市场有望在2025年和2026年大幅扩张。根据Canalys预测,到2027年60%的PC将具备人工智能功能。
浙商证券认为,AI PC为各领域提供创新解决方案:
1)高速AI处理:AI PC能快速处理图像识别、语音识别、自然语言处理等AI任务,提高生产力和娱乐体验;
2)增加AI应用:ISV有望提供NPU应用程序,将AI功能整合到现有应用程序中;
3)新用例开发:AI PC推动新的业务用例和服务,包括医疗诊断、自动驾驶等多领域;
4)提升用户体验:通过语音、手势互动、AI个性化支持和高级安全功能改善用户体验。
从AI PC进展来看,“英特尔on技术创新大会2023”官宣将在今年12月14日正式发布面向下一代的AI PC的英特尔酷睿Ultra处理器Meteor Lake ,以加速“AI PC”时代的到来。
此外,英特尔提出“AI PC加速计划”,宣布将为软件合作伙伴提供工程软件和资源,以在2025年前实现为超过1亿台PC实现人工智能特性:
首次引入了针对人工智能加速的NPU:NPU能与所有计算引擎的内置AI功能结合实现更高能效的AI计算,通过NPU降低CPU和GPU的AI工作负载,带来高能低耗的表现。
通过GPU、NPU、CPU不同层级的AI算力网络,MeteorLake能很好的将AI从云端引入到客户端PC和企业边缘PC。
“AIPC加速计划”,旨在为软件合作伙伴提供工程软件和资源。酷睿Ultra处理器“MeteorLake”将于12月14日正式发售。
10月24日,联想举行了主题为“AI for All”的“2023联想Tech World创新科技大会”,重点展示了联想在端侧大模型方面的能力,以及联想的首款AI PC产品:
个性化优势凸显:相比云端公用大模型,联想PC级大模型Lenovo AI Now在面对“去斯德哥尔摩的音乐节的行程规划”问题时表现出更加个性化,能够将家庭地址、酒店偏好等考虑进去。
AI PC预计2024年9月后上市,未来还将进入车端。杨元庆会后表示,搭载端侧大模型的PC要明年9月以后才上市,按照规律前期将占有10%的市场份额,日后会成为主流。此外,联想表示未来端侧大模型还将进入车端。
推出针对企业用户的混合人工智能计划,旨在保护数据安全。通用训练后大模型可通过企业的特定数据进行额外的训练和微调;在端侧再加入企业知识矢量数据库中的特定知识,最后链接旧有ERP系统、CRM系统、MES系统等供应商数据库,得到混合AI系统。
AI 手机:产业爆发前夜
浙商证券认为,AI手机有望成为个人智能助理,为手机行业带来创新,对比苹果2011年推出的手机助手Siri:Siri采用一问一答的形式,而AI手机具有人格化、记忆、感知和管理能力,触发主动服务,具体来看:
1)智能化和便利的服务体验:手机作为使用频率最高,使用时间最长的电子产品,也是链接智能汽车、PC、耳机以及其他智能终端的中枢,植入AI大模型后能成为真正的个人智能助理。
例如语音助手能提供更自然的交互与更精准的意图识别服务,图像识别和处理功能可以为手机带来更出色的拍照和图像处理能力,文本生成能力可用于快速撰写购物评价、生成发言稿等场景。
2)数据更加安全精确:AI手机需要的数据保存在端侧更安全,较云有隐私优势,手机用户自己生成的数据对于智能助理的训练更加精确。
3)从单个AI应用到统一AI生态:融入手机系统中的大模型,可以打破各APP之间的壁垒,比如邮件、备忘录、日历的互相调用,在某一工
作节点发送特定邮件。
AI手机进展:
1.高通成功将AI布局在安卓手机,2023年2月23日,高通技术公司成功在搭载了骁龙芯片的安卓手机上运行了Stable Diffusion,作为一款现象级应用,Stable Diffusion可以基于大模型从文本生成图片,神奇的背后是复杂的模型和巨大的运算量,其模型参数超过10亿个。
2.谷歌发布全新Pixel 8系列手机,搭载谷歌自研Tensor G3处理器和Titan M2安全芯片,在手机上首次应用AI智能大模型。谷歌还发布了新版安卓系统Android 14,以及生成式AI加持的谷歌助手Assistant with Bard。
3.华为/小米/OPPO/VIVO
华为发布HarmonyOS 4 :通过盘古大模型的底层能力加持,华为将为用户带来智慧终端交互、高阶生产力效率、个性化服务的全新AI体验变革。
小米澎湃OS:自研端侧大模型MiLM,轻量化语言模型 (13亿参数),手机端侧大模型部分场景效果媲美云端,进一步实现“人/车/家全生态”智能化。
OPPO Andes GPT模型:Andes GPT作为OPPO自主训练的生成式专属大模型,以端云协同为基础架构设计思路,推出从10亿至千亿多种不同参数规模的模型规格。10月11日,联发科宣布携手 OPPO 、 ColorOS , 合作共建轻量化大模型端侧部署方案,共同推动大模型能力在端侧逐步落地。
VIVOOriginOS 4:联发科与VIVO在AI领域展开深度合作,率先实现了10亿和70亿参数AI大语言模型、10亿参数AI视觉大模型在手机端侧的地。
端侧AI需要强大芯片硬件支持
考虑到硬件配套、隐私安全、用户体验等,“云侧+端侧”的协同设计思路成为手机行业共识。
模型训练需要巨大的算力,一定都会在云端进行,与云端大模型不同,手机无法支撑通用大模型百万亿甚至千亿级别的参数,在此类消费级终端需要做适配处理,提升用户体验:
1.明确云侧和端侧的特点和功能,各取所长,协同工作。云侧→大模型训练;端侧→推理。
2.需要对手机SoC芯片做一定的升级,增加大模型所需的GPU、NPU、APU等单元。
3.精简参数,降低内存占用,以适配手机硬件。减小参数量、量化技术调整、有争对的精调模型等,使模型能够在端侧流畅应用。e.g.高通使用AI模型增效工具包(AIMET)将模型从FP32缩小到INT8。
本文观点主要来自于浙商证券研报:《2024 ·AI“下凡”——端侧AI深度跟踪报告》分析师蒋高振,华尔街见闻略有删节