近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

田柯宇为何被字节跳动起诉?

两个月前,字节跳动的大模型训练集群遭到北京大学实习生的恶意攻击,导致公司蒙受了巨大的损失。

据称,田柯宇本科毕业于北航软件学院,研究生就读于北大,师从王立威教授,研究兴趣为深度学习的优化与算法。

自2021年起,开始在字节跳动实习研究,具体包括超参数优化、强化学习算法、自监督的新型算法。

因为对团队内部的一些情况不满,出于泄愤的心理采取了报复行动。

他巧妙地利用了Hugging Face平台上用于加载检查点(checkpoint)文件的函数中的一个漏洞,制作了一个表面无害但实际上包含了恶意负载的检查点文件。通过这种方式,他实现了远程代码执行,能够篡改模型权重、调整训练参数或窃取模型数据。

根据知名博主“Jack Cui”的分析,该实习生可能使用的就是这种方法:通过注入恶意代码动态修改其他人的优化器设置,改变参数梯度的方向,并且在训练过程中随机插入暂停指令(sleep)。这使得模型在反向传播时计算出的梯度被篡改,从而朝着错误的方向进行优化;同时,插入的暂停指令也显著减缓了模型训练的速度。

面对舆论的质疑,田某本人曾出面否认与此事有关,声称自己在发布论文后已经从字节离职,真正的幕后黑手可能是趁其离职之际嫁祸于他。

然而,一个多月后, 媒体报道显示,法院正式受理了字节跳动针对前实习生田某某提起的诉讼。最终判决要求田某某赔偿侵权造成的损失800万元人民币及合理费用2万元,并公开道歉。

字节官方进一步澄清,此次受到破坏的是研究项目,而非商业化的正式项目或公司的大型模型业务。

结果,这名实习生不仅被字节跳动辞退,而且案件也被移交至其所在学校处理。

最佳论文说了啥?

据悉,这篇NeurIPS 2024第六高分的论文(7,8,8,8)是田柯宇在字节跳动商业化技术部门实习期间,与团队合作发表的,题目为《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》(视觉自回归建模:通过Next-Scale预测生成可扩展图像)。

该研究重新定义了图像上的自回归学习,采用了从粗到细的“下一个尺度预测”或“下一个分辨率预测”的方法,而非传统的光栅扫描“下一个token预测”。这种多尺度的方法不仅模拟了人类感知图像的过程,即先捕获全局结构再逐步添加局部细节,而且在多个方面超越了当前主流的扩散模型。

根据论文报告,在ImageNet 256×256条件生成基准测试中,新模型——视觉自回归建模(VAR),将Fréchet Inception距离(FID)从18.65降低到了1.73,并且Inception得分(IS)从80.4提高到了350.2。此外,推理速度提高了20倍,展示了显著的性能提升和效率改进。

值得注意的是,VAR模型还在数据效率、零样本泛化能力以及下游任务应用等方面表现优异。例如,在图像修复、外延和编辑等任务中也展现了其价值。为了进一步推动这一领域的研究,田柯宇团队已将所有模型和代码开源至GitHub平台,获得了超过4.4k的星标关注。

尽管田柯宇因早前对实习公司的恶意攻击行为而面临法律诉讼,此次获奖无疑彰显了他的学术才能和技术实力。此事件也引发了关于个人行为与职业成就之间关系的讨论。

责编:Demi
阅读全文,请先
您可能感兴趣
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
人工智能(AI)功能已经在各种移动设备中变得至关重要。尤其是2024年,AI PC陆续推向市场,甚至可以称为“边缘设备AI元年”。 这次我们就来盘点一下2024年下半年发布的主要AI PC和处理器。
借着传说中Intel在中国举办的有史以来规模最大的生态大会,谈谈AI PC生态于2024收官之际大致发展到了哪儿...
锡作为AI技术生产的重要原料之一,其需求有望成为新的增长点。而中国有色矿业公司也希望锁定这种在关键矿物清单上占据重要地位的锡的供应。
HBM4将用于特斯拉正在开发的AI数据中心及其自动驾驶汽车。其中,特斯拉采购HBM4芯片将用于强化其超级电脑Dojo的性能。
如果新的法规能够实施,特斯拉毫无疑问将能够更自由地部署其无人驾驶技术,从而推动无人驾驶出租车(如Cybercab)的大规模生产。
随着汽车行业在“新四化”领域内迅猛地进步,汽车电子电气架构正在发生显著的变化。汽车对GPU算力的需求呈现出爆发增长的趋势。
AOZ1390DI 具有先进的 LPS 功能,可显著降低危险条件下的风险
全新SiWx917Y模块凭借全球射频认证提供即插即用的简便性
日前,由中国国际公共关系协会(CIPRA)主办的“第二十届中国公共关系行业最佳案例大赛”评选结果在北京正式揭晓。英飞凌提报的《“英飞凌•绿领未来”整合营销传播项目》经过层层筛选和专业评审,荣获“ESG(环境、社会、公司治理)与企业形象类”金奖。
2024,中国车市卷出新高度,不少中国车企和供应商试图“出海”寻找新的增长曲线。一方面,中国汽车市场虽庞大,但近年来随着内销增长趋于饱和,以及今年开年以来新能源汽车价格战愈演愈烈,车企们迫切需要寻找新
NVIDIA 软件和加速计算集成(包括 NVIDIA Blackwell)提供了全栈平台以推动企业在亚马逊云科技上的开发工作为了扩展开发者和企业在云端的可能性,NVIDIA 和亚马逊云科技(Amazo
CINNO Research产业资讯,12月3日,日本显示器株式会社(JDI,Japan Display Incorporation)成功研发出全球首款采用HMO(High Mobility Oxid
会议预告“知雄守雌,返本复初”,12月12日-13日,”2024年(第七届)移动机器人产业发展年会暨第二届移动机器人采购经理峰会”将在江苏苏州举行,敬请关注!同时发布全球首台空集装箱堆码机器人!文|新
印度尼西亚表示,已收到苹果公司价值10亿美元的投资改善方案,这是这家科技巨头为解除在东南亚最大经济体销售iPhone 16设备的禁令而做出的最新努力。印尼投资部长Rosan Roeslani周二(12
 今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----对于繁忙的城市和公共
本文来源:智能通信定位圈星闪技术作为中国原生的一种新型短距离无线通信技术,集结了现有主流短距通信技术蓝牙、WiFi等传统技术的优势,具备低延时、精定位、高吞吐、抗干扰、高并发和高可靠的六大技术特点。自
多模态大语言模型是当前AI领域的热点之一,其核心在于能够同时处理和理解多种类型的数据,包括文本、图像、音频等。这一特性使其在智能客服、内容创作、图像识别、虚拟助理等领域展现出巨大的应用潜力与价值。无论
亲爱的开发者朋友们,属于我们的年度技术盛宴即将拉开帷幕!🎉为了让大家参会更便捷,我们特别推出了【2024RDC快乐参会路径】:1报名参会动动手指,锁定席位!2安排行程选个最顺手的交通方式,轻松前往!3