如何打造 iOS 短视频的极致丝滑体验,阿里工程师用了这些方案

原创 阿里云视频云 2021-08-27 17:24

内容作为 App 产品新的促活点,受到了越来越多的重视与投入,短视频则是增加用户粘性、增加用户停留时长的一把利器。短视频的内容与体验直接关系到用户是否愿意长时停留,盒马也提出全链路内容视频化的规划,以实现商品力表达的提升。目前已有短视频场景包括:首页、搜索、商品详情、达人秀、沉浸式视频、真香视频、盒区首页 feeds 流、话题、UGC 内容、话题合集落地页、社群、菜谱、盒拍一键剪、直播回放、weex 等。

作者|神捕

审校|泰一

本次优化的目标是将盒马 App 与主流短视频 App 体验对齐,如抖音、手淘等。优化具体的硬性指标有播放成功率、卡顿率、秒开率。另外,为了反应用户观看短视频过程中的真实体验,盒马还新增了体感指标:首帧渲染时长。

优化效果对比


以上视频测试基于 iPhone 6S,可以看到抖音在大多数情况下,在滑到下个视频后,可以立即开始播放;而盒马优化前,滑到下个视频后,会先展示封面图,再继续播放,有个闪跳的过程。优化后的盒马,效果已经与抖音效果接近。

为了衡量优化前后与抖音的体验对比,目前采用录屏数帧的方式,算出视频页面完全展示到首帧渲染时刻的耗时,体感数据如下:

此外还有一些硬性指标的优化,结果如下:

优化方案

在本次优化前期,调研了阿里集团内不少优秀的方案,大多数都是接入了手淘播放器,内核基于开源的 ijkPlayer。但播放器层面本身门槛较高,且手淘已优化较好了,所以本次的优化方向主要集中在上层业务的预加载方案上。具体从以下几个方面入手:

统一视频播放代理与缓存

视频的加载速度,很大程度上取决于从网络下载的耗时,增加视频缓存可以有效提高视频二次播放速度。为实现缓存机制,需要引入代理服务器,接手视频数据下载流程,如下:

A. 优化前播放流程:

B. 优化后播放流程:

业务层往播放器设置 videoUrl 前,先对原始 videoUrl 加密,替换成 127.0.0.1 的本地 proxyUrl, 将请求引导到代理 webServer,此时调用 proxy 模块进行视频原始视频 url 的解析、缓存的读取或远程请求,最终再通过 server 返回数据给播放器。

视频播放增加中间代理也是业界常见手段,盒马依赖的手淘播放器也有现成的代理服务,但其代理功能放在另一个独立的 DW 库中,对盒马是冗余的,且目前 SDK 暂未支持独立的预下载接口,上层无法做首播优化。所以目前盒马做了独立的代理层,以支持上层灵活的定制。

自建代理还有个好处是,一些业务并非使用统一手淘播放器的场景也能同时享受到缓存服务,比如一些 flutter 页面使用的系统播放器。至少缓存的管理,目前设置了缓存区最大值的保护,在每次 App 回到前台时,进行视频缓存的清理。

针对 m3u8 的代理与缓存

除了常见的 mp4 视频外,日常还会遇到 m3u8 的视频,比如盒马中的直播回放视频。(视频链接)

该类视频与 mp4 不同,在请求 url 时并非直接返回视频流,而是先返回 playlist 文本,playlist 中才是可播放的各个视频片断,如下:

这种视频的缓存处理,采用的是修改 m3u8 playlist 中的 url,替换为代理 url 实现,就可以走代理了。之前 iOS 侧对 m3u8 的缓存支持有问题会 crash,原因是修改了 m3u8 的 Playlist 的第 1 个视频的 url 为代理 proxyUrl 后,播放第一片段正常,但后续的片段 url 仍是原始 url,手淘播放器在加载这种原始相对 url 路径时,内部会拼接上第一小段的域名和 path,导致第二段以后的 url 有问题,直接 crash。目前的处理方式是,把 playlist 中所有 url 全部改成代理 url 的 fullpath 即可。

这样有了 mp4 和 m3u8 两种视频后,完整流程如下:

独立预加载能力

上述的代理缓存,能提升二次播放速度,但对首次播放的视频,仍然无缓存可用,下载过程依然很耗时。所以需要独立的预加载能力,配合业务层,在合适的时机提前进行视频数据的下载(无渲染)。

目前底层提供 [HMVideoLoader preLoadUrls:URLS] 方法,内部根据 url 进行视频缓存,下载大小限制 1M。多个视频同时预下载时,串行执行,保证不过多占用带宽,影响业务处理,等用户划动到视频位置时,可以直接开始播放,达到首开速度优化。

需要提下的是,此处的预加载,复用了上述代理类,也以 url 为 key 进行数据缓存,这样后续的二次播放也可以读取同一个的缓存。如果预加载过程中,滑到了该视频开始播放,则先停止预加载任务,避免同个视频的重复下载引起缓存冲突。

视频码率、分辨率优化

视频的预加载、代理缓存,都是基于提前准备视频数据角度考虑,这有个前提,就是准备时间很短,业务可以及时使用,如果视频很大,网络较差,业务又需要立即消费,则可能无法享受到优化效果,所以需要在视频码率、分辨率上进一步优化。

早期盒马都是播的 H264 视频,并且都是高清视频,这在很多 feeds 流上其实是用不上这么大的,影响加载速度且浪费流量。目前已在 cloudVideo 上申请配置了 H265 转码,盒马视频上传后可同时获取 265,264 两路视频,且有高清、标清、普清 3 种分辨率,这样就给端上按业务场景选择带来了自由度。先看下切换后同个视频大小的对比:

A. H264 切为 H265(都是高清):原始 H264 大小为 10.6M,切换后变为 7.1M

B. 切到 H265 并且修改分辨率:原始 H264 为 21M,切换后变为 8.3M

从这两个例子可以看到,同个视频都是高清前提下,切到 H265 视频后,大小下降了约 30%,如果同时又降低分辨率到标清,视频大小减小非常明显,这意味视频码率下降了,用户可以更快下载到首帧数据。

目前盒马服务端接口已改造支持直接返回 H265 视频地址,iOS 这边的策略是:优先使用 h265,并按当前环境,请求不同分辨率:

A. iOS11 以下,使用 h264;iOS11 及以上,使用 h265 (手淘播放器默认已开启硬解)

B. 分辨率,按当前机型(高、中、低)、网络类型(wifi/4g)、当前网络情况(强、弱)定义不同的分辨率请求顺序,如下,最终返回的数组按顺序拼成分辨率参数优先级,比如 hd#sd#ld 表示优先高清。

static NSString * const VIDEO_HD = @"hd";
static NSString * const VIDEO_SD = @"sd";
static NSString * const VIDEO_LD = @"ld";
static NSString * const VIDEO_HD_H265 = @"hd_265";
static NSString * const VIDEO_SD_H265 = @"sd_265";
static NSString * const VIDEO_LD_H265 = @"ld_265";

+ (NSArray*) getExpectedVideoDefinition {
    NSArray *VIDEO_PRIORITY_GOOD_ENV = nil;
    NSArray *VIDEO_PRIORITY_NORMAL_ENV = nil;
    NSArray *VIDEO_PRIORITY_BAD_ENV = nil;

    if ([[[UIDevice currentDevice] systemVersion] compare:@"11.0" options:NSNumericSearch] == NSOrderedAscending) {
        VIDEO_PRIORITY_GOOD_ENV = @[VIDEO_HD, VIDEO_SD, VIDEO_LD];
        VIDEO_PRIORITY_NORMAL_ENV = @[VIDEO_SD, VIDEO_LD, VIDEO_HD];
        VIDEO_PRIORITY_BAD_ENV = @[VIDEO_LD, VIDEO_SD, VIDEO_HD];
    }
    else{
        VIDEO_PRIORITY_GOOD_ENV = @[VIDEO_HD_H265, VIDEO_SD_H265, VIDEO_LD_H265];
        VIDEO_PRIORITY_NORMAL_ENV = @[VIDEO_SD_H265, VIDEO_LD_H265, VIDEO_HD_H265];
        VIDEO_PRIORITY_BAD_ENV = @[VIDEO_LD_H265, VIDEO_SD_H265, VIDEO_HD_H265];
    }

    AliHADeviceEvaluationLevel deviceLevel = [AliHADeviceEvaluation evaluationForDeviceLevel];
    NetworkQualityStatus networkQualityStatus = [[NWNetworkQualityMonitor shareInstance] currentNetworkQualityStatus];
    NetworkStatus nwStatus = [[NWReachabilityManager shareInstance] currentNetworkStatus];
        
    NSArray *videoPriority = VIDEO_PRIORITY_NORMAL_ENV;
    if (networkQualityStatus == SEMP_StrongSemaphore) {
        if (deviceLevel == HIGH_END_DEVICE) {
            videoPriority = VIDEO_PRIORITY_GOOD_ENV;
        } else {
            if (nwStatus == ReachableViaWiFi) {
                videoPriority = VIDEO_PRIORITY_NORMAL_ENV;
            } else {
                videoPriority = VIDEO_PRIORITY_BAD_ENV;
            }
        }
    } else {
        if (deviceLevel == HIGH_END_DEVICE || deviceLevel == MEDIUM_DEVICE) {
            videoPriority = VIDEO_PRIORITY_NORMAL_ENV;
        } else {
            videoPriority = VIDEO_PRIORITY_BAD_ENV;
        }
    }
    
    return videoPriority;
}

沉浸式视频翻页体感优化

上述方案上线完,回头看数据,平均加载速度提升了,但仍然有近 200ms 的加载时长,这其中包括了播放器初始化以及下载或加载缓存数据、渲染首帧的过程,究其原因,在大量用户复杂网络环境下,很难保证所有人都有最佳体验。200ms 在全屏的沉浸式视频场景中,虽然比之前快了很多,还是会让用户感受到瞬间的不流畅,即用户翻到下一页后,仍停留了一小段时间才播放了首帧。更糟糕的是,盒马上的视频,很多视频的封面图是达人自行上传的,很有可能与首帧不一样,这样从封面图跳到首帧的停顿感就更明显了。

为达到抖音那种丝滑的感觉,除了上述措施外,还需要在上层体感上再做一层预处理,这里采用了双播放器策略,如下:

基本流程是,播放当前视频的同时,预先实例化第二个播放器,加载视频 url 并播放到首帧后暂停,第 3、4 个视频进行串行预下载(预下载是纯下载的过程,无渲染逻辑)。在增加了下一个视频的 “预播” 机制后,用户滑到下个视频时,可以立即从首帧的暂停状态恢复为播放,不再需要预先显示封面图,也提高了播放体感上的速度。除视频以外的业务数据的渲染,可以放在用户滑动翻页的过程中进行。

首个视频的加载优化

上述优化了用户翻页的体验,但这种沉浸式页面的第一个视频的加载体验,仍需要单独拿出来优化,因为进入页面时,并没有给它留下预加载时机。如下:

如图所示,进入沉浸式页面时,总需要先请求页面 videoList 数据,然后再串行请求第一个视频的数据,就算加了封面图,也会让用户感受到慢。为此,现在修改策略为右图,在跳到沉浸式页面时需要前个页面提前传入 videoUrl,提前进行播放,同时进行 mtop 请求,渲染业务数据。这样保证了视频与业务数据的加载可以异步执行,由于用户主要目光是集中在视频上的,所以从用户的视角直观的来看,页面加载速度变快了。

音频体验优化

早期盒马这边没关注音频方面的优化,也收到了不少反馈,目前制定优化策略如下:

  1. App 启动不打断音乐。
  2. 进入音频独占页面(如真香视频、沉浸式视频)时,打断音乐。
  3. 退出 App 或退到后台时,恢复音乐。
  4. 音频播放不受静音键控制(类似抖音)。

后续优化方向

  1. 播放器层提供进一步封装:封装视频加载、预加载、双播放器、屏幕内首个视频判断、退出、暂停等所有边界逻辑,目前各个业务需要考虑较多这种边界情况,可以考虑在封装层收掉。
  2. 页面之间播放进度无缝切换:从小尺寸视频点击切换到沉浸式全屏过程,实现无缝切换,播放进度承接上个页面,音频也不打断。这样可以进一步优化沉浸式页面首个视频的体验,彻底实现 “0 耗时” 体感。
  3. 多视频同时播放的性能优化:盒马大多数场景下只会同时播放 1 个视频,但部分业务需要同时播放多个视频,此时对内存、滚动性能提出较高挑战。
  4. 视频转 Gif:针对部分场景下满屏都是视频又需要同时播放的情况,如果同时实例化 N 个播放器,效果可想而知。考虑尝试在视频内容生产阶段,同步生产 gif 图源,特定场景下 APP 可使用 gif 替换播放器实现预览。
  5. 视频剪辑 — 语音转字幕:之前已基于淘拍能力在盒马上建立起了视频剪辑功能,为内容生产者提供常见、简单易用的编辑能力。考虑新增语音转字幕模块,用于增强视频内盒马商品力表达。

下一期我们将继续分享盒马 iOS / Android 端短视频的体验优化实践。

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。
阿里云视频云 「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领
评论
  • 应用趋势与客户需求,AI PC的未来展望随着人工智能(AI)技术的日益成熟,AI PC(人工智能个人电脑)逐渐成为消费者和企业工作中的重要工具。这类产品集成了最新的AI处理器,如NPU、CPU和GPU,并具备许多智能化功能,为用户带来更高效且直观的操作体验。AI PC的目标是提升工作和日常生活的效率,通过深度学习与自然语言处理等技术,实现更流畅的多任务处理、实时翻译、语音助手、图像生成等功能,满足现代用户对生产力和娱乐的双重需求。随着各行各业对数字转型需求的增长,AI PC也开始在各个领域中显示
    百佳泰测试实验室 2025-02-27 14:08 267浏览
  • 振动样品磁强计是一种用于测量材料磁性的精密仪器,广泛应用于科研、工业检测等领域。然而,其测量准确度会受到多种因素的影响,下面我们将逐一分析这些因素。一、温度因素温度是影响振动样品磁强计测量准确度的重要因素之一。随着温度的变化,材料的磁性也会发生变化,从而影响测量结果的准确性。因此,在进行磁性测量时,应确保恒温环境,以减少温度波动对测量结果的影响。二、样品制备样品的制备过程同样会影响振动样品磁强计的测量准确度。样品的形状、尺寸和表面处理等因素都会对测量结果产生影响。为了确保测量准确度,应严格按照规
    锦正茂科技 2025-02-28 14:05 154浏览
  • 在2024年的科技征程中,具身智能的发展已成为全球关注的焦点。从实验室到现实应用,这一领域正以前所未有的速度推进,改写着人类与机器的互动边界。这一年,我们见证了具身智能技术的突破与变革,它不仅落地各行各业,带来新的机遇,更在深刻影响着我们的生活方式和思维方式。随着相关技术的飞速发展,具身智能不再仅仅是一个技术概念,更像是一把神奇的钥匙。身后的众多行业,无论愿意与否,都像是被卷入一场伟大变革浪潮中的船只,注定要被这股汹涌的力量重塑航向。01为什么是具身智能?为什么在中国?最近,中国具身智能行业的进
    艾迈斯欧司朗 2025-02-28 15:45 243浏览
  • 美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?‌美国加州CEC能效认证与美国DOE能效认证在多个方面存在显著差异‌。认证范围和适用地区‌CEC能效认证‌:仅适用于在加利福尼亚州销售的电器产品。CEC认证的范围包括制冷设备、房间空调、中央空调、便携式空调、加热器、热水器、游泳池加热器、卫浴配件、光源、应急灯具、交通信号模块、灯具、洗碗机、洗衣机、干衣机、烹饪器具、电机和压缩机、变压器、外置电源、消费类电子设备
    张工nx808593 2025-02-27 18:04 128浏览
  •           近日受某专业机构邀请,参加了官方举办的《广东省科技创新条例》宣讲会。在与会之前,作为一名技术工作者一直认为技术的法例都是保密和侵权方面的,而潜意识中感觉法律有束缚创新工作的进行可能。通过一个上午学习新法,对广东省的科技创新有了新的认识。广东是改革的前沿阵地,是科技创新的沃土,企业是创新的主要个体。《广东省科技创新条例》是广东省为促进科技创新、推动高质量发展而制定的地方性法规,主要内容包括: 总则:明确立法目
    广州铁金刚 2025-02-28 10:14 111浏览
  • 1,微软下载免费Visual Studio Code2,安装C/C++插件,如果无法直接点击下载, 可以选择手动install from VSIX:ms-vscode.cpptools-1.23.6@win32-x64.vsix3,安装C/C++编译器MniGW (MinGW在 Windows 环境下提供类似于 Unix/Linux 环境下的开发工具,使开发者能够轻松地在 Windows 上编写和编译 C、C++ 等程序.)4,C/C++插件扩展设置中添加Include Path 5,
    黎查 2025-02-28 14:39 151浏览
  • 在物联网领域中,无线射频技术作为设备间通信的核心手段,已深度渗透工业自动化、智慧城市及智能家居等多元场景。然而,随着物联网设备接入规模的不断扩大,如何降低运维成本,提升通信数据的传输速度和响应时间,实现更广泛、更稳定的覆盖已成为当前亟待解决的系统性难题。SoC无线收发模块-RFM25A12在此背景下,华普微创新推出了一款高性能、远距离与高性价比的Sub-GHz无线SoC收发模块RFM25A12,旨在提升射频性能以满足行业中日益增长与复杂的设备互联需求。值得一提的是,RFM25A12还支持Wi-S
    华普微HOPERF 2025-02-28 09:06 166浏览
  • 一、VSM的基本原理震动样品磁强计(Vibrating Sample Magnetometer,简称VSM)是一种灵敏且高效的磁性测量仪器。其基本工作原理是利用震动样品在探测线圈中引起的变化磁场来产生感应电压,这个感应电压与样品的磁矩成正比。因此,通过测量这个感应电压,我们就能够精确地确定样品的磁矩。在VSM中,被测量的样品通常被固定在一个震动头上,并以一定的频率和振幅震动。这种震动在探测线圈中引起了变化的磁通量,从而产生了一个交流电信号。这个信号的幅度和样品的磁矩有着直接的关系。因此,通过仔细
    锦正茂科技 2025-02-28 13:30 108浏览
  • 构建巨量的驾驶场景时,测试ADAS和AD系统面临着巨大挑战,如传统的实验设计(Design of Experiments, DoE)方法难以有效覆盖识别驾驶边缘场景案例,但这些边缘案例恰恰是进一步提升自动驾驶系统性能的关键。一、传统解决方案:静态DoE标准的DoE方案旨在系统性地探索场景的参数空间,从而确保能够实现完全的测试覆盖范围。但在边缘案例,比如暴露在潜在安全风险的场景或是ADAS系统性能极限场景时,DoE方案通常会失效,让我们看一些常见的DoE方案:1、网格搜索法(Grid)实现原理:将
    康谋 2025-02-27 10:00 258浏览
  • RGB灯光无法同步?细致的动态光效设定反而成为产品客诉来源!随着科技的进步和消费者需求变化,电脑接口设备单一功能性已无法满足市场需求,因此在产品上增加「动态光效」的形式便应运而生,藉此吸引消费者目光。这种RGB灯光效果,不仅能增强电脑周边产品的视觉吸引力,还能为用户提供个性化的体验,展现独特自我风格。如今,笔记本电脑、键盘、鼠标、鼠标垫、耳机、显示器等多种电脑接口设备多数已配备动态光效。这些设备的灯光效果会随着音乐节奏、游戏情节或使用者的设置而变化。想象一个画面,当一名游戏玩家,按下电源开关,整
    百佳泰测试实验室 2025-02-27 14:15 140浏览
  •         近日,广电计量在聚焦离子束(FIB)领域编写的专业著作《聚焦离子束:失效分析》正式出版,填补了国内聚焦离子束领域实践性专业书籍的空白,为该领域的技术发展与知识传播提供了重要助力。         随着芯片技术不断发展,芯片的集成度越来越高,结构也日益复杂。这使得传统的失效分析方法面临巨大挑战。FIB技术的出现,为芯片失效分析带来了新的解决方案。它能够在纳米尺度上对芯片进行精确加工和分析。当芯
    广电计量 2025-02-28 09:15 141浏览
  • 请移步 gitee 仓库 https://gitee.com/Newcapec_cn/LiteOS-M_V5.0.2-Release_STM32F103_CubeMX/blob/main/Docs/%E5%9F%BA%E4%BA%8ESTM32F103RCT6%E7%A7%BB%E6%A4%8DLiteOS-M-V5.0.2-Release.md基于STM32F103RCT6移植LiteOS-M-V5.0.2-Release下载源码kernel_liteos_m: OpenHarmon
    逮到一只程序猿 2025-02-27 08:56 204浏览
  • Matter 协议,原名 CHIP(Connected Home over IP),是由苹果、谷歌、亚马逊和三星等科技巨头联合ZigBee联盟(现连接标准联盟CSA)共同推出的一套基于IP协议的智能家居连接标准,旨在打破智能家居设备之间的 “语言障碍”,实现真正的互联互通。然而,目标与现实之间总有落差,前期阶段的Matter 协议由于设备支持类型有限、设备生态协同滞后以及设备通信协议割裂等原因,并未能彻底消除智能家居中的“设备孤岛”现象,但随着2025年的到来,这些现象都将得到完美的解决。近期,
    华普微HOPERF 2025-02-27 10:32 241浏览
  • 更多生命体征指标风靡的背后都只有一个原因:更多人将健康排在人生第一顺位!“AGEs,也就是晚期糖基化终末产物,英文名Advanced Glycation End-products,是存在于我们体内的一种代谢产物” 艾迈斯欧司朗亚太区健康监测高级市场经理王亚琴说道,“相信业内的朋友都会有关注,最近该指标的热度很高,它可以用来评估人的生活方式是否健康。”据悉,AGEs是可穿戴健康监测领域的一个“萌新”指标,近来备受关注。如果站在学术角度来理解它,那么AGEs是在非酶促条件下,蛋白质、氨基酸
    艾迈斯欧司朗 2025-02-27 14:50 426浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦