可能更关注芯片的读者,对于华为手机始终有个困惑,就是在某些众所周知的限制条件下,华为手机是如何与其他同时代手机产品保持相似的系统体验、图形与综合性能的。
虽然要回答这个问题可能比较复杂,但其中有个要素一定是HarmonyOS——鸿蒙操作系统。今年HDC华为开发者大会上,余承东(华为常务董事、终端BG董事长、智能汽车解决方案BU董事长)宣布HarmonyOS NEXT开发者beta版正式推出。华为终端BG软件部总裁龚体说,HarmonyOS NEXT整机性能会比上代提升30%。
“甚至超过芯片工艺制程升级两代带来的整机性能提升。”而且后续每年都要让整机性能再提升20-30%——从“系统架构和生态上”寻求这部分性能。这30%是从哪儿来的?传说中HarmonyOS NEXT上的AI特性,所谓的Harmony Intelligence又是怎么回事?还有听说这代系统的安全隐私特性是个亮点?
本文尝试从这几个层面来谈谈新发布的HarmonyOS NEXT。(相关阅读:细谈盘古大模型5.0和华为AI生态:有哪些技术点?)
1. 30%性能提升是怎么做到的?
从HarmonyOS发布之初就在关注这款操作系统的读者,对于鸿蒙内核、EROFS(文件系统)、方舟编译器之类的构成应该不会陌生。华为将相关操作系统底层的这部分关键技术称为“根技术”。
相关HarmonyOS,从内核,到文件系统、数据库、编程语言,及上层应用层——包括现在AI时代流行的模型,乃至扩展到云的“端云整合”能力,HarmonyOS的关键构成如下:
“我们用10年时间干成了欧美同行30年才做成的事”主要说的就是这些核心组成部分的构建了。其中,用于替代Linux内核的鸿蒙内核性能提升10.7%;EROF文件系统则相比较EXT4,随机读性能强1.2-3倍,且可节省存储空间2GB以上;
而ArkData数据库,是把GaussDB(高斯数据库)技术带到了端侧,介绍中提到它有高性能、更智能、多模态的特点,强调的主要还是包括AI相关的KV计算/caching、KV读写性能是iOS的“20倍”这样的属性;
通过借助鸿蒙生态的工具(ArkTS、方舟编译器等),开发者的应用经过编译优化或重新编译之后,三方app的性能据说也能提升10%;方舟多媒体引擎,令“出图快3倍”、“音视频播放负载下降30%”,并且引入HDR Vivid标准,“动态显示范围提升2.7倍”;
加上基于方天视窗开发的方舟图形引擎“是业界首个高并行、低负载的统一渲染引擎”,“2D绘制性能提升26%,同时功耗还下降了10%”。
另外,这次连接不同鸿蒙设备的分布式软总线——也就是基于华为自主网的传输机制——“在更低的功耗下连接速度提升3倍;连接设备数量更多;功耗降低20%”...
上述“根技术”,加上宣传中提到“芯、硬、软、云”的整合,整体实现了30%的整机性能提升。这部分相关的,发布会上有个重要发布:编程语言仓颉开启预览,可下载体验。
2. HarmonyOS NEXT为什么叫“纯血版鸿蒙”?
有关“纯血版”的问题,华为在发布会上并未过多提及。我们认为,“纯血”一方面体现在操作系统上述自有组件成分更高,以及在app开发生态上,更加往“鸿蒙原生应用”靠拢:包括更多的应用基于鸿蒙生态——HarmonyOS SDK原生互联Kit开发,以及HarmonyOS本身提供更好的系统能力。
余承东说,现在鸿蒙原生应用实现了TOP 5000应用的全覆盖。也就是说最常用的5000款应用实现了鸿蒙原生化。这些应用占到消费者使用时长的99.9%,覆盖工作、生活、办公、出行等领域。而且国内的不少企业内应用,包括招商银行、中国邮政、新华社、一汽出行、南方电网等的企业内应用也都转向了鸿蒙原生。
“鸿蒙原生”的价值就用户和开发者而言,还是不小的。比如HarmonyOS覆盖手机、平板、电视、车机等不同类型设备的“全场景”操作系统。基于鸿蒙生态开发app,最具吸引力的应当是可实现一次开发、多端部署;以及不同设备间,app的跨端协同、跨设备互通、应用接续等——现在是靠近就能无感连接,比如手机导航app,靠近车机时就能转到车机上。
华为为此提供了18个垂类的代码样例,包括电商购物、语音娱乐、骑车出行等,用龚体的话来说是“照着来就可以”。
另外还有跨屏拖拽、安全摄像头、小艺建议之类的能力就不多提了;所谓的“元服务”,系统提供NFC唤起、桌面卡片、实况窗、场景感知、智能提醒等的能力;可调用的底层能力涵盖3000+ API,50+场景化控件。据说这些显著降低了开发门槛,最快1天就能够完成开发、测试、上架全过程。
有关鸿蒙开发生态,有几点我们认为比较重要的系统“能力”值得一提。
其一是带来性能方面的提升。在“操作系统与应用联合深度优化”的情况下,HarmonyOS NEXT淘宝app的结算场景比上代HarmonyOS 5快1.5倍、美团app页面间跳转速度快1.3倍、美图秀秀P图快1.7倍、微博首页滑动速度快1.3倍、图库app借助FFRT技术与方舟多媒体引擎性能提升1.4倍......
其二,HarmonyOS提供云相关的能力,比如云渲染能力支持。发布会上,华为没有具体解释“云渲染”的流程,例如哪些渲染工作交给云完成,延迟如何等。不过《诛仙2》很快就准备将云渲染技术加入进去了,实现“PC级光线追踪画质”。
《诛仙2》游戏制作人说云渲染支持每秒超过10亿条光线的全局渲染,“这是高端显卡才能提供的”。与此同时,借助“云编译”,《诛仙2》首次加载速度提升了6倍。不知道未来面向本地app会不会有更多类似的云能力提供。
其三,在于开发生态易用性和难易度方面。华为和开发者共建了鸿蒙生态伙伴SDK和三方框架——有个重点是和合作伙伴“共建20+鸿蒙原生行业应用‘样板间’”,覆盖新闻、金融、政务等领域。这些“样板间”能够缩短开发时间。比如说“人民网+”就是用新闻样板间开发的,80%的公共特性代码覆盖;“蜻蜓点睛”用了金融样板间,85%公共特性代码复用,而且还满足了安全与合规要求...
其他开发工具方面的提升,包括IDE(DevEco Studio)做了大量优化,跨语言编码效率、编译构建速度、问题定位等都有了提升。相关开发资源、服务、技术支持等就不多赘述了:发布会现场,金山办公、蚂蚁mPaaS都站了台,讲述开发鸿蒙原生应用的经验和合作。
比较令人印象深刻的是蚂蚁mPaaS作为一个app开发平台、中间件,提到支持“某亿级用户app”,“原生鸿蒙改造完成后”,性能测试数据显示app满帧运行、应用启动<85ms,点击响应<100ms。“这应该说是性能优化TOP级别数据了,远超我们的预期,因为我们只优化了一个版本。”蚂蚁mPaaS相关负责人说,对他们的开发者客户群而言,鸿蒙的基本适配所需时间很短。
3. Harmony Intelligence的AI能力鸡肋吗?
大概在过去一年多的时间里,我们普遍认为时下主流的AI手机、AI PC,都没有找准正确的端侧AI打开方式,导致除了早就应用AI的存量app,新增AI体验大部分情况下十分鸡肋。
而华为这次在HarmonyOS NEXT中新推的Harmony Intelligence(鸿蒙原生智能),是在我们看来和Apple Intelligence唯二构成本地AI高可用性、改善用户体验的解决方案。不过这种能力的达成,大概也真的只有像华为、苹果这类同时在做芯、硬、软、云,集多重身份于一身的角色才能快速搞定了,毕竟操作系统和生态都掌握在自己手里。
首先,鸿蒙原生智能应该是个端云协同的方案,即很多情况下端和云的AI算力共同发挥作用。而且与系统内“各个子系统深度融合,通过控件开放给开发者”。简单来说,这种AI是内嵌在系统中的能力,通过AI控件的方式,向app开发者开放——包括AI抠图、AI搜索、图文翻译、表格提取、OCR识别服务推荐、拍摄输入、人脸检测等。
那么开发者就可以把这些能力直接用到app中,不需要再自行开发和部署自己的智能系统。这既简化了开发流程,也能巩固自家的生态优势。值得一提的是,这套方案也面向三方AI模型开放。
谈具体的AI功能,比如基于大模型用人物照片来生成卡通风格图片;照片扩图、照片中不必要元素消除;面向语言障碍人群的AI声音修复等,这些都算是基础能力。借助本地传感器来感知环境,是边缘与端侧AI价值体现所在:手机通过语音或文字描述摄像头拍到的对象,是AI应用中更进一步的...
这些涵盖通话、文档、搜索、媒体、文本、跨应用协同在内的智能,都可以由三方app直接调用。这些都只是基础配置,HarmonyOS中的“小艺”能力升级在我们看来才是关键,华为称其为“小艺智能体”。小艺智能体的基础是盘古大模型,所以新版小艺支持“23类常用的记忆类型”;“更强的推理规划能力”;“掌握万亿token的知识量”;“更加开放,300+服务,通过意图框架接入”。华为终端BG首席执行官何刚介绍说。
现在的小艺常驻在了系统导航栏上。只需要把对应的内容拖拽到导航栏,小艺就能对内容做出分析和响应。比如说有人发来一段会议通知,告知会议时间、地点等;直接把这段话拖拽到导航栏,小艺就能创建对应的会议日程。
比较具有代表性的例子,比如对小艺说“发短信给XX,告诉他后天下午足球比赛的地点”。此时小艺首先从日历中找到足球赛的行程事件,再从通讯录中找到XX,然后编辑短信将足球赛时间、地点整理成一段话,让用户确认以后就可以直接发出去了。
再比如对小艺说“把昨天鸿蒙应用开发的会议材料中,涉及技术的几页转为PDF文档”,则小艺会找到对应的材料,找出“涉及技术的几页”,转为PDF文档。这句话中有两个包含了情境和需要判断的部分,其一是“昨天鸿蒙应用开发的会议材料”——唯有具备记忆能力,才能做到;而其二是“涉及技术的几页”,是个高级判断能力。不知道这一例中,后一个高级判断是否需要云算力接入。
这两个例子体现的是小艺组织协调整个系统中不同组成部分的能力,以及极强的推理规划能力。
至于把包含表格的图片“投喂”给小艺,小艺将图转为表格文件;或者把一份文档拖拽给小艺,让他总结摘要,或者针对性提问;以及针对团建邮件中的地址,问小艺“去这里要多久”或“导航去这个地方”这种以前机器根本无法理解的“指代”,在系统级能力面前都是小问题...
在智能终端功能走向复杂化的今天,这种交互方式的走向几乎是必然,即用户没有必要去关心某个复杂功能具体如何实现,交给AI即可。
值得一提的是上面的框架图中,“意图框架”是连接小艺智能体与应用服务的桥梁。“HarmonyOS的意图框架通过多维系统感知、大模型AI能力,来实现用户显性与潜在意图理解,匹配合适的服务,以提供多模态、个性化的场景体验。”何刚说,意图框架将来能够理解的意图垂类会越来越多。
“通过知识和记忆的引入,全场景个性化的分发也会更加自然和精准。”“目前已经有超过300个不同类的服务通过意图框架接入小艺智能体。”比如说,支付宝基于用户位置在“小艺建议”卡片中,提供服务组合,包括支付方法、支付内容;在出行app中,让小艺规划行程,交互包括出行人数、时间、地点等信息来个性化旅游方案,以及订机票等...
第三方应用因此也就能够借助小艺智能体的能力,改变和用户的交互方式。前面提到的这些,是非生态系统掌握者无法达成的高级AI智能,也真正让AI在用户体验层面产生了价值。
4. 还有个“原生安全”是什么?
一般来说,安全不是用户会过多关心的问题——安全放到台面上来说,既枯燥,又妨碍用户体验。不过HarmonyOS NEXT在安全隐私方面的改进,有一部分也强化了用户体验。何刚形容其为“颠覆性创新”,“通过底层和体验重构,打造全方位安全的操作系统”。
这次的安全机制更新名为“星盾安全架构”。从开发生态的角度来看,新系统是从“开发”“发布”“运行”三个环节确保安全,是“对整个系统机制的治理”。典型如新的应用市场有新的安全检测机制;运行环节,应用出现违规行为就会禁止运行......这些体现的还是“纯血版鸿蒙”的生态掌控力。
而从权限获取的角度,是这次很多人关注的有关“原生安全”的焦点。即以往某些app要求用户授予通话记录、短信、联系人列表、剪贴板、相机、地理位置、文件、图库使用权限,这很容易造成隐私的泄露和被滥用。
HarmonyOS的思路是,把这些权限申请从系统层面全部取消,三方app无法再获取这些权限;相对的转变为app可获取特定数据:比如说要在某个社交应用中设置头像,以往应用就需要获取相机或相册访问权限——而在HarmonyOS中,用户只授权数据,也就是对应的一张照片,且为单次授权。
而在扫码场景中,app以前需要相机和图库权限。在HarmonyOS的安全访问机制下,应用使用相机只能得到扫码的结果。“这个过程中,应用方便了,消费者也方便,隐私保护也能做好。”
这对移动生态而言绝对是一次针对隐私权限的革新,只是一方面不知道具体操作时,对于某些类别的应用是否会影响使用体验(比如总是单次授权特定数据会让用户操作变得麻烦),以及以商业目的为考量、靠权限达成精准投放的部分开发商如何看待此问题…
还有一点相关安全的“数据高安”:包括单设备硬件级一文一密、多设备传输数据加密,多人协同时文件分享也是可控的;以及所谓系统级未成年人模式等。
以下是HarmonyOS SDK提供给开发者的安全能力,也是纯血鸿蒙原生应用的关键组成部分了;支付宝、招商银行、建设银行等都已经接入金融级安全能力:
因此与安全能力相关的,鸿蒙内核获得了国际CC EAL 6+证书,“这是操作系统内核领域首个通过6+等级的认证”;而HarmonyOS NEXT系统则得到CCRC EAL 5+认证,“也是业界唯一获得此认证的操作系统”。
HarmonyOS NEXT开发者和先锋用户Beta版率先面向包括华为Mate 60系列、Mate X5系列和MatePad Pro 13.2英寸这三款设备开放;今年8月,HarmonyOS NEXT面向大众的Beta版会对包括Pura 70在内的更多机型开放;正式版预计于Q4问世。
从全场景的角度来看,余承东表示可穿戴、手机、智能家居、座舱、智慧屏、平板等鸿蒙生态设备已经超过9亿台,鸿蒙旨在“赋能千行百业”;在不同品类中,鸿蒙也都占据不错的市场份额。而当鸿蒙冠以“纯血”名号,且要求更多原生应用接入时,现在才是鸿蒙生态真正接受考验的时刻;也是HarmonyOS新征程的开端,鸿蒙生态也因此需要背负更多的责任。