抱怨IC寒冬?AI博士也在NeurIPS现场崩溃?行业平淡了我们怎么办?

路科验证 2024-12-26 12:15
【新智元导读】在NeurIPS上,NYU计算机教授看到了一群沮丧和焦虑的博士。AI读博的红利已经消失,五年前那种毕业即被疯抢、高薪又自由的好日子,已经彻底没了。没赶上好时代的博士们,只能一声长叹。

前不久,UC伯克利CS本科生毕业即失业的故事,曾引起坊间热议。
没想到,CS博士生的日子也并不好过?
最近,NYU计算机和数据科学教授Kyunghyun Cho的一篇博客,成为圈内热议的话题。
这篇博客的题目十分触目惊心:《我在NeurIPS’24上感受到了焦虑和挫败》。
他表示,在NeurIPS 2024上非常突出的一件事,就是高年级博士生和博士后表现出的焦虑和沮丧。
如今的就业市场,跟五年前他们开始攻读博士学位时,已经有了很大不同,很多人都找不到合适的工作。
曾经第一代幸运的博士(包括教授本人)之所以成功,更多是因为运气好。
但如今,博士学位的种种红利和必要性很快就要消失了,本科生和硕士生就完全足够进行AI研究,完成企业所需的标准化机器学习开发技能。
而随着AI技术的产品化,企业更需要的是支持产品迭代的工程师,而非AI博士。
总之,AI人才培养体系已被破坏,公司并不需要那么多博士——他们已经被排除在AI人才培养体系这次大规模重组之外。
谷歌DeepMind的研究科学家Sander Dieleman表示,情况完全属实,因为如今学生毕业后进入的就业市场,与曾经完全不同。
毕竟在自己的博士生涯年代,可是发生了ImageNet时刻。
有人现身说法表示,没错,自己就是这样的倒霉蛋之一。
今年刚加入英伟达的高级软件工程师Duong Hoang称,自己为了攻读博士学位,并没有在2010年代加入这些科技大厂,相当于是直接放弃了数百万美元的收入。
博士的就业市场竞争如此激烈,也是因为薪水太高,但HC太少。
这种现象可以用一个名词来概括——「精英生产过剩」。
的确,机器学习的工作没有消失,只是从机器学习研究转向了机器学习工程而已。
因为大多数企业的机器学习问题,都可以通过现成的工具来解决,公司并不需要学者,优秀的程序员足矣。解决方案的价值跟学历无关。
而如今市场对LLM的痴迷,只是硅谷的又一个炒作周期而已。几年后流行的可能就是不同的东西。
总结来说就是:十年前,行业挑选了少量的AI博士生,来应对即将爆发的AI革命。高薪让博士生申请者如飞蛾扑火般涌入,LLM的价值火速被证明。
随后,本科生和硕士生也被训练出来,对企业来说已经够用了。博士生们只能含泪退出。

教授博客全文

Kyunghyun Cho的博客全文如下——
上周在NeurIPS 2024会议上有一个非常突出的现象,那就是即将毕业的博士生和博士后们表现出了强烈的焦虑和沮丧。
如今的就业市场令他们感到困惑,因为市场的样貌和感受与五年前他们申请博士项目时的预期大相径庭。而且,这些博士生和博士后中,有一些还是我亲自指导的。
这让我开始反思AI研究和发展的现状,以及过去的演变。

最初的时候

过去十年左右,对机器学习或更广泛的AI领域来说,是一个非常有趣的时期。
从大约2010年的语音识别开始,深度学习在许多具有挑战性且实用的问题上(如目标识别和机器翻译),相较于当时的技术水平有了显著提升。
到了2014年,很明显,一场重大变革正在发生。每一家大公司,无论是科技公司还是非科技公司,都希望自己能参与这场持续的革命,并且从中受益。
由于深度学习在很长一段时间里都不是主流,因此几乎没有本科课程会认真教授相关的基本概念和技术。
事实上,在当时的许多机器学习和AI课程中,人工神经网络仅仅是被简单提及而已。
这就导致了深度学习人才供需之间极大的不平衡,迫使那些比其他公司更早看到这场革命的公司,从全球为数不多的实验室中积极招募博士生。
由于当时全球只有少数实验室在认真研究深度学习,所以这些它们的毕业生甚至教授会被疯抢。
因此,拥有人工神经网络经验和专业知识的博士生薪酬自然水涨船高,进一步拉大了AI领域内此方向上学术界与产业界的薪酬差距,大学想要招聘此类人才教育学生,也就更加困难。
在2010年到2015年获得博士学位、研究人工神经网络、成为大学终身教职的人极少,我就是为数不多的其中之一。
这就导致了人才供应的增长大大延迟,同时需求却仍在飙升。
由此还带来了一个有趣的副作用:即使招聘的人才无法直接带来显著的经济效益和利润增长,公司也依然愿意雇佣他们。
之所以如此,是因为公司已经提前看到了即将到来的AI革命,它即将改变所有业务。
因此,当时被雇用的许多博士生非常自由,可以随意选择自己想研究的主题、发想发的paper。
本质上来说,这就像一份学术研究职位,但却有高达2到5倍的薪酬,以及更高的知名度!而且,还没有教学任务、行政负担,也没有申请项目的压力。
总之就是两个字——完美!
当时的大学生、高中生,甚至是初中生,也都看到了这一点:只要研究与AI相关,就能获得高薪、优渥福利,还能随意选择研究课题。
既然这些几乎仅限在人工神经网络发过学术论文的博士生,那自然就有大量博士申请者涌入,争相成为如今的AI博士。
不过尽管申请者激增,并不意味着最终会有大量博士生,因为限制因素是导师的数量。
在15年之前,只有少数实验室在研究人工神经网络,但到了2016年,许多教授都把自己实验室转型成了深度学习实验室,并且招收大量博士生扩展实验室规模。
看起来,似乎我们已经建起了一个优秀的AI人才培养体系。
大量优秀学生申请博士项目,大量从事AI研究的教授接收、培养这些学生,使他们成为下一代博士。少数大型科技公司和机构,以难以想象的优厚薪酬和研究自由来吸引他们。
然而,这种模式并不可持续。事后看来,这一点是显而易见的。

变革的开始

要让这种模式持续下去,唯一的办法是让深度学习继续成为能够在五年内彻底变革工业(甚至整个社会)的技术,并且每年都必须是「未来五年」。
如前所述,公司之所以招聘这些人才,并投资于他们的研究环境,是基于对未来不可避免变革的预期。换句话说,这种培养体系的延续,取决于他们所准备的那个未来。
第一代幸运的博士(当然也包括我)进入这一领域,选择的原因并不是出于职业前景,而更多是因为运气。
随后,我们开始有一批更加聪明、目标明确的博士生从事深度学习研究。这些人极其有动力不是靠运气而是凭借才能和热情被选中,因此他们取得了更快、更显著的进展。
不久之后,这些进展就开始转化为实际产品。特别是以可对话的LLM为代表的大模型,开始证明这些产品确实是革命性的,既能改变未来,也能在当下创造经济价值。
换句话说,这些新一代的优秀博士生通过将深度学习产品化(例如LLM及其变体),成功地将未来带到了现在。
产品化意味着很多事情,但有两个方面尤为重要:
- 首先,产品化需要在开发和部署过程中,实现某种程度的标准化。
然而,这种过程标准化与科学研究是背道而驰的。
我们不需要持续不断的创造性和颠覆性创新,而是基于标准化流程的渐进式、稳定的改进。而博士生在这一点上表现得很差,因为这与博士项目的培养目标完全相悖。
博士生的任务是提出创新性的想法,通过理论或实证验证这些想法,将研究结果写成论文,向学术界报告,然后继续进行下一步研究。
一旦研究成果被转化成实际的产品,我们就不能简单地「继续前进」,而是需要持续支持和维护它
于是,随着一套完善的流程的建立,对博士学位的需求会迅速下降。
- 其次,产品化为收入创造了一条清晰且具体的路径。
这对那些投资招聘了这些优秀人才,并为其提供资源以便在公司内部而非其他地方进行创新的企业来说,是件好事。
然而,一旦出现了明确的盈利方向(最终目标是实现利润),研究人员想要继续要求完全的研究自由,就变得越来越困难。
许多人会被要求直接为产品做出贡献,并证明他们薪酬和岗位的合理性,只有少数人能够继续享有研究自由。
这很正常,同时也解释了为什么在大多数组织(包括盈利性、非盈利性和政府机构)中,研究团队通常比产品团队规模更小,资源更少。
此外,在过去几年中,大学在一定程度上赶上了需求,开始教育和培养本科生和硕士生,使他们掌握这些新技术的基础知识和实践理念。
他们不仅知道如何训练、测试和部署这些模型,还了解其背后的理论理念。更重要的是,他们通常比博士生更谦逊,也更愿意接受新事物。
这些因素,共同彻底打破了前文所述的AI人才培养梯队。

不需要那么多博士了

公司不再需要像以前那么多博士生,因为他们可以直接招聘本科生或硕士生,他们能按标准化流程,理解为AI产品走出贡献。
学生也并不需要进入博士项目来学习必要技能,在大学的本科课程中就能学到。
当前这一批博士生,当初就是冲着良好的职业前景选择读博,如今却在这场AI人才培养体系的大重组中,被彻底边缘化。
于是,不出所料的,这些接近博士项目尾声的学生会感到极度焦虑和沮丧。
他们曾仰慕我们这一代人(虽然我们还算年轻且资历尚浅,但在这个领域可能已经算是资历较深的一批),并认为只要他们的博士学位与机器学习及相关领域有关联,他们就能像我们一样,成为在大科技公司中享有高度研究自由、薪资丰厚的研究科学家。
然而,在他们看来,求职市场突然要求他们专注于一个更狭窄的领域——LLM及其变体——并展示自己的创新能力,同时直接为基于大规模模型开发的产品贡献力量。
如果不愿意参与大规模语言模型的产品化工作,那么可供选择的机会将少之又少,而这些岗位正在迅速减少。
尽管如此,这也并不意味着大模型之外的AI研究课题就不重要或不被需要。
例如,Prescient Design就一直在持续招聘专注于不确定性量化、因果机器学习、几何深度学习、计算机视觉等领域的博士级研究科学家,因为这些领域的研究与开发与他们所做的工作(lab-in-the-loop)直接相关。
大模型只是近年来备受关注的一个特定的AI子领域。这些大模型取得的进展和突破确实让人感到无比兴奋,但它们并不是唯一值得关注和投资的领域。
然而,这种对大规模语言模型及其变体的极度关注很容易让我们,尤其是那些仍在学业中的学生,甚至是所谓精英大学的教职人员,变得盲目。
无论合理与否,被关注都会带来更多的机会,如果学生没有发表或正在写有关大模型的论文,他们感到焦虑是很自然的,因为这些机会与他们无缘。
这样看来,我在NeurIPS 2024上从博士和博士后们那里感受到的强烈沮丧和焦虑,就完全可以理解了。
他们中的一些人可能感觉自己被「背刺」了,因为他们曾被承诺的前景与现实之间的差距正在迅速扩大。
有些人可能会感到无助,因为他们选择的研究课题和工作似乎不再受到这些公司的欢迎。
有些人可能会感到挫败,因为本科生或硕士生似乎在训练和部署这些大规模模型方面更为熟练,并且看起来比他们更有价值。
不幸的是,我只能部分理解这些极其聪明的学生所感受到的焦虑和沮丧的根源,却想不出办法来缓解这种沮丧。
毕竟,看起来我可能在无意中极大地促成了这种让他们对职业和未来感到沮丧和焦虑的局面。
抱歉!
参考资料:
https://x.com/kchonyc/status/1870563085796184131
https://www.reddit.com/r/MachineLearning/comments/1hjp5gc/d_i_sensed_anxiety_and_frustration_at_neurips24/


*免责声明:本文由作者原创。文章内容系作者个人观点,路科验证转载不代表路科验证对该观点赞同或支持,如果有任何异议,欢迎联系路科验证。

路科验证 专注于数字芯片验证的系统思想和前沿工程领域。路桑是Intel资深验证专家,主持验证架构规划和方法学研究,担任过亿门级通信芯片的验证经理角色。在工程领域之外,他在西安电子科技大学和西安交通大学客座讲授芯片验证课程。著有书籍《芯片验证漫游指南》。
评论
  • “金字招牌”的户外叙事。2024年的夏天似乎异常炙热,体育迷们的心跳也随之澎湃,全球瞩目的体育盛宴——巴黎奥运会在此刻上映。在这个充满荣耀与梦想的夏天,我们见证了无数激动人心的瞬间:男子4X100米混合泳接力决赛中,潘展乐的最后一棒,气壮山河,中国队的历史性夺冠,让整个泳池沸腾;射击10米气步枪混合团体决赛,黄雨婷和盛李豪的精准射击,为中国队射落首金,展现了年轻一代的力量;乒乓球男单四分之一比赛中,樊振东的惊天逆转令人难以忘怀,凭借坚韧不拔的意志和卓越的技术,成功挺进半决赛,并最终夺冠……在这一
    艾迈斯欧司朗 2024-12-25 19:30 64浏览
  • 据IDTechEx最新预计,到2034年,全球汽车舱内传感(In-Cabin Sensing,ICS)市场将超过85亿美元。若按照增长幅度来看,包含驾驶员监控系统(DMS)、乘员监控系统(OMS)、手势控制和生命体征监测等高级功能在内的舱内传感市场预计2020年到2034年将增长11倍。感光百科:ICS中的光源选择01、政策推动带来的“硬”增长作为其中的增长主力,舱内监控系统应用(包含DMS和OMS等)被推动增长的首要因素正是法规。据统计,中国、欧盟、美国、韩国、印度等主要汽车国家或地区已推出相
    艾迈斯欧司朗 2024-12-25 19:56 63浏览
  • 今年AI技术的话题不断,随着相关应用服务的陆续推出,AI的趋势已经是一个明确的趋势及方向,这也连带使得AI服务器的出货量开始加速成长。AI服务器因为有着极高的运算效能,伴随而来的即是大量的热能产生,因此散热效能便成为一个格外重要的议题。其实不只AI服务器有着散热的问题,随着Intel及AMD 的CPU规格也不断地在提升,非AI应用的服务器的散热问题也是不容小觑的潜在问题。即便如此,由于目前的液冷技术仍有许多待克服的地方,例如像是建置成本昂贵,机壳、轨道、水路、数据中心等项目都得重新设计来过,维修
    百佳泰测试实验室 2024-12-26 16:33 58浏览
  • 概述 Intel 要求用户为其10代FPGA器件使用特定的上电和掉电顺序,这就要求用户在进行FPGA硬件设计的时候必须选择恰当的FPGA供电方案,并合理控制完整的供电上电顺序。经过在Cyclone 10 GX测试板上实际验证,统一上电确实会导致FPGA无法正常工作,具体表现为JTAG接口无法探测或识别到目标器件。上电顺序要求 Cyclone 10 GX,Arria 10以及Stratix 10系列器件所有的电源轨被划分成了三个组合,三组电源轨要求依次上电,如图1所示,为三组电源轨上电顺序示意图。
    coyoo 2024-12-25 14:13 48浏览
  • 引言  LIN(Local Interconnect Network)是一种针对汽车电子系统应用的串行通信协议,主要用于汽车电子控制单元(ECU)之间的通信。LIN总线的特点是成本低、速率低、通信距离短、连接节点少,主要用于对带块要求低、实时性要求不高的控制任务,例如车门控制、天窗控制、座椅控制、车内照明等功能。LIN总线采用的是主从式架构,由主节点基于调度表调度网络中的通信。  LIN总线的错误类型  尽管LIN协议设计简单,具有低带
    北汇信息 2024-12-25 14:18 57浏览
  • 本文介绍瑞芯微开发板/主板Android系统APK签名文件使用方法,触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,各类接口一应俱全,帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。系统签名文件生成APK系统签名文件,具体可参考此文章方法RK3588主板/开发板Android12系统APK签名文件生成方法,干货满满使用方法第一步,修改APK工程文件app/src/build.gradle,并添加以下内容: android {     na
    Industio_触觉智能 2024-12-26 09:20 69浏览
  • 在PCB设计中,Stub(也称为短桩线或残桩线)对信号传输有以下几个主要影响:1.容性效应导致的阻抗偏低:Stub会导致容性效应,使得阻抗偏低,影响信道的阻抗一致性。Stub越长,阻抗降低得越多。这是因为传输线瞬态阻抗计算公式为:Z = \ sqrt { \ frac { L } { C } }Stub就像并联在传输线上的小电容,Stub越长,电容量越大,阻抗也就越低。2.信号反射:当信号在传输线与Stub的交界处遇到阻抗不匹配时,会产生信号反射。这会导致信号的失真和能量的反向传播,增加了噪声和
    为昕科技 2024-12-24 18:10 29浏览
  • RK3506是瑞芯微Rockchip在2024年第四季度全新推出的Arm嵌入式芯片平台,三核Cortex-A7+单核Cortex-M0多核异构设计,CPU频率达1.5Ghz, M0 MCU为200Mhz。RK3506平台各型号芯片该怎么选,看这篇文章就够了。RK3506各型号RK3506有3个型号,分别是RK3506G2、RK3506B、RK3506J,配置参数如图: 配置差异解析总的来说,RK3506各型号间的差异主要体现在内存、工作温度和封装上‌:内存差异‌:RK3506G2‌集成
    Industio_触觉智能 2024-12-25 10:27 31浏览
  • 新能源汽车市场潮起潮落,只有潮水退去,才能看清谁在裸泳。十年前,一批新能源汽车新势力带着创新的理念和先进的技术,如雨后春笋般涌入中国汽车市场,掀起一场新旧势力的角逐。经历市场的激烈洗礼与投资泡沫的挤压,蔚来、理想、小鹏等新势力车企脱颖而出,刷爆网络。不曾想,今年新势力车企杀出一匹“超级黑马”,爬上新势力车企销量榜前三,将蔚来、小鹏等昔日强者甩在了身后,它就是零跑汽车。公开数据显示,11月份,零跑汽车实现新车交付量约4.02万辆,同比增长117%,单月销量首次突破4万辆;小鹏汽车当月共交付新车约3
    刘旷 2024-12-26 10:53 105浏览
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-26 09:19 88浏览
  • 全球照明技术创新领航者艾迈斯欧司朗,于2024年广州国际照明展览会同期,举办【智慧之光】· 艾迈斯欧司朗-照明应用研讨会,以持续的技术创新,推动光+概念的全面落地。现场还演示了多款领先照明技术,且由资深工程师倾情解读,另有行业大咖深度洞察分享,助你开启“光的无限可能”探索之旅!精彩大咖分享引领未来照明无限遐想艾迈斯欧司朗精心准备了照明领域专业大咖的深度分享,无论是照明领域的资深从业者,还是对照明科技充满好奇的探索者,在这里,您都将大有所获。在艾迈斯欧司朗照明全球产品市场VP Geral
    艾迈斯欧司朗 2024-12-25 20:05 49浏览
  • 在谐振器(无源晶振)S&A250B测试软件中,DLD1到DLD7主要用于分析晶体在不同驱动功率下的阻抗变化。此外,还有其他DLD参数用于反映晶振的磁滞现象,以及其频率和功率特性。这些参数可以帮助工程师全面了解KOAN晶振在不同功率条件下的动态特性,从而优化其应用和性能。磁滞现象晶振的磁滞现象(Hysteresis)是指在驱动功率变化时,晶体的阻抗或频率无法立即恢复至初始状态,而表现出滞后效应。1. DLDH: Hysteresis Ratio (MaxR/MinR)在不同驱动
    koan-xtal 2024-12-26 12:41 68浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦