随着诸多技术突破和新的流媒体音乐服务的不断融合将Pro Audio高保真(Hi-Fi)功能带入移动设备,未来对于智能手机、平板电脑和其他移动设备来说是非常灿烂的。正如高清电视改变了人们看电视的方式,Hi-Fi音频将成为便携式设备,尤其是智能手机的下一件大事。
事实上,在优化移动设备的声音质量方面发生了许多变化。Hi-Fi音频功能可以减少噪音、失真或其他数字干扰的影响,例如前铃振声音,尽管听众可能没有意识到,但毫无疑问会影响他们的聆听体验。而驱动程序和增强功能则将为移动音质带来“黑胶唱片般的质感”,却不会消耗太多电量。
第一个指向Hi-Fi音响的指标,是流媒体音乐订阅的增加。据MIDiA全球流媒体音乐用户研究协会(MIDiA Research Streaming Music Subscribers)2016年12月的报告显示,流媒体音乐用户数量从2014年到2016年翻了一番,从4,100万用户增加到1亿,预计到2020年将达到2.77亿。另外, 《BuzzAngle 2016美国音乐产业报告》指出,2016年美国任何一天的日均流量(平均每日12亿)比全年的歌曲下载量还多(7.334亿)。MIDiA数据显示,以Spotify(4300万订阅者)、Tidal(约100万)、Deezer(690万)和Apple Music(2090万)为代表的流媒体服务正在主导整个市场。目前,只有Tidal和QobuzTM提供Hi-Fi流媒体,而Deezer、Soundcloud和JooxTM则提供部分Hi-Fi音效。如果Spotify、苹果和亚马逊等大公司开始提供Hi-Fi流媒体播放,那么预计市场将大幅增长。根据SAR Insight&Consulting1预测,到2020年,高分辨率音频(HRA)的下载量将从全球音乐下载量的1%(2016年)增加至11%。
图1. SAR Insight&Consulting预测,到2020年,高分辨率音频下载量将增加至全球音乐下载量的11%。
在早期用户的引领下,这些服务将唤醒用户在目前的智能手机设备上根本无法体验到的完全不同的音乐体验。但为什么目前的智能手机或其他移动设备的音质这么差?这与移动产品的物理限制有关:尺寸、重量和电池寿命。目前,各种技术限制交织在一起,阻碍了高性价比的Hi-Fi音频在便携式设备上的应用,但是这种情况正在发生转变。
“Hi-Fi”音频是如何定义的?简单来说,它是尽可能接近原始音乐源的低噪声和低失真音频。在更技术的层面上,Hi-Fi音频是指允许“无损”声音传输的比特率。为了压缩音乐,系统会忽略掉它认为人耳听不到的声音,以节省存储空间。然而,这种“有损”压缩,即MP3,却确实降低了音频质量,因为人耳实际上可以辨别出这种差异。
这就解释了为什么在某些便携式设备上收听压缩音乐时,一般用户都可以听出“差异”,但不知道为什么。将Hi-Fi音频传输到移动设备时,还会带来其他的挑战。过去,移动设备的存储量不够。只是到了现在,智能手机才有了足够的存储空间来跟上更高分辨率的音频。事实上,移动产品的存储容量在过去几年中呈指数级增长,因此存储大量无损音频文件(如免费无损音频编解码器(FLAC))文件)已经不成问题。这意味着用户不必在音频质量上妥协,就能够在手机上存储多张专辑。此外,许多在线音乐存储公司现在允许用户下载,还可以随意删除歌曲和专辑,从而无需将整个音乐集存储在手机上。
音频芯片设计人员也在不断开发,努力将高性能功能集成到更轻巧的部件中。这些组件不仅尺寸变小,而且功耗更低,最大限度地延长电池寿命。尺寸和功耗是轻型智能手机或可穿戴式设备的物理因素要求。其他技术性的音频设计元素被用于优化压缩音乐和流媒体播放。
消费者可能对特定的规格参数比较关注,规格确实能给产品重现高质量音频的能力提供很好的参考。然而,高质量的音频却不仅仅只是规格。除了达到某些数据等级,如16位/96kHz甚至更高,在重现清澈的Hi-Fi音频方面,有许多微妙的额外因素需要被考虑到。这些因素会对音频质量产生巨大影响。
比如,抖动会破坏再现的音频质量。所有时钟信号都受抖动的影响。在典型的系统中,如果抖动总量低于-105dBFS,抖动的声音听不到。在音频系统中一开始就要考虑到时钟性能,实质上它必须是音频系统DNA的一部分。这包括提供准确的参考时钟或围绕专用的精确锁频环(FLL)设计IC以补偿不准确的参考时钟。通过锁定外部基准和提供原始参考时钟的低抖动替代,片上FLL为内部的数模转换器(DAC)和放大器提供了低抖动的时钟基准。
先进的Hi-Fi滤波器最初是为了高性能DAC而设计的,应用于许多高端专业的音响系统中,现在也被应用在便携式应用的智能编解码器中。这意味着,智能手机、平板电脑和其他产品现在也能享受自然的声音了。
精心设计的Hi-Fi滤波器可最大限度地减少数字信号处理的影响。下图是高级512单位元DAC架构的图形表示,它顺序滤除噪声,以帮助消除数字世界的影响,并提供自然的人们最想听到的声音。
图2 Cirrus Logic CS 43130中的512单位元DAC图示
除了减少抖动这一影响音效的因素外,滤波器还能改变滚降和相位响应,从而消除前铃振。例如,铙钹碰撞的声音通常是人们不想听到的,因为在开始击打时它的声音总是不清楚并伴随着一些杂音。
前铃振是在数字处理的过程中人为制造的,导致人们在真实的声音出现之前听到一些声音。这意味着声音并不像它应该有的那样清晰。现实世界中不存在能够发出前铃振的声音,人耳对前铃振声也非常敏感。如果滤波器在数字模拟转换的过程中没有正确运作,再现的声音往往听起来模糊低沉,暗哑呆板。
下图通过使用Cirrus Logic CS43130低功耗DAC带来的真实效果,展示了如何通过滤波器去除前铃振,并提供了一系列可供选择的滤波器。左图中的可视声波可被视为优先的主要音频信号(比如打鼓声)。后铃振指声音产生后的现实世界中确实存在的声音,比如鼓被击打后的振动。但是,前振铃声波是数字处理过程中音频滤波器操作失败所导致的结果。如右图所示,先进的Hi-Fi滤波器和变化范围更大的滤波器能够消除前铃振,使后铃振更富变化、更自然,呈现高质量的声音效果。
图3 Cirrus Logic CS 43130 DAC中先进的Hi-Fi滤波器消除前铃振示例
对于无失真自然声数字音频来说,动态范围是音频工程中另一个非常重要的因素。人耳的动态范围很广,既能听到非常轻的声音也能听到非常响的声音。这一音量范围被称为动态范围。
为使最大信号范围被正确再现,高性能DAC的高动态范围非常关键。如果DAC的动态范围很低,特别是在低于96dB的情况下,增大音量时,用户会听到数字本底噪声。一个典型的16位MP3文件的动态范围是96dB。在当今先进的Hi-Fi音频格式中,24位FLAC的动态范围是144dB,32位音频的动态范围也相应更广。(FLAC是类似于MP3的一种音频格式,不同的是,FLAC是无损的,意味着它即使被压缩音质也不受损。)通过提供高达130dB的动态范围,在所有的放大器增益设置中,最小和最大的数字信号能够在不受底噪声影响的情况下被传递。
在移动设备上聆听数字音乐在全世界范围内日益流行,在便携设备中运用上述音频技术可谓正逢其时。最近尼尔森发布的《2016中国音乐360报告》充分地证明了这一点。报告披露,72%的中国人平均每周听音乐的时间为16小时,千禧一代甚至高达19小时;66%的音乐收听者(69%的千禧一代)通过智能手机听音乐。作为一个超过10亿人口的国家,中国一个国家的情况就预示了智能手机音频领域巨大的增长潜力,智能手机制造商对这一趋势也密切关注。流媒体音乐服务的涌现和订阅者的增长、Hi-Fi音频的流行,进一步推动了对移动设备Hi-Fi音频的需求。当芯片技术提供商还在攻克芯片大小、存储量、电池寿命和其他移动平台上的诸多限制时,音频器件的设计师则打开了研发新技术以提升用户聆听体验的大门。这就是为什么Hi-Fi音频能够继智能手机、平板电脑和可穿戴设备之后成为下一个市场焦点。将高质量的专业音频带到移动设备中去,这并不遥远,在此时此地即将实现。