近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

田柯宇为何被字节跳动起诉?

两个月前,字节跳动的大模型训练集群遭到北京大学实习生的恶意攻击,导致公司蒙受了巨大的损失。

据称,田柯宇本科毕业于北航软件学院,研究生就读于北大,师从王立威教授,研究兴趣为深度学习的优化与算法。

自2021年起,开始在字节跳动实习研究,具体包括超参数优化、强化学习算法、自监督的新型算法。

因为对团队内部的一些情况不满,出于泄愤的心理采取了报复行动。

他巧妙地利用了Hugging Face平台上用于加载检查点(checkpoint)文件的函数中的一个漏洞,制作了一个表面无害但实际上包含了恶意负载的检查点文件。通过这种方式,他实现了远程代码执行,能够篡改模型权重、调整训练参数或窃取模型数据。

根据知名博主“Jack Cui”的分析,该实习生可能使用的就是这种方法:通过注入恶意代码动态修改其他人的优化器设置,改变参数梯度的方向,并且在训练过程中随机插入暂停指令(sleep)。这使得模型在反向传播时计算出的梯度被篡改,从而朝着错误的方向进行优化;同时,插入的暂停指令也显著减缓了模型训练的速度。

面对舆论的质疑,田某本人曾出面否认与此事有关,声称自己在发布论文后已经从字节离职,真正的幕后黑手可能是趁其离职之际嫁祸于他。

然而,一个多月后, 媒体报道显示,法院正式受理了字节跳动针对前实习生田某某提起的诉讼。最终判决要求田某某赔偿侵权造成的损失800万元人民币及合理费用2万元,并公开道歉。

字节官方进一步澄清,此次受到破坏的是研究项目,而非商业化的正式项目或公司的大型模型业务。

结果,这名实习生不仅被字节跳动辞退,而且案件也被移交至其所在学校处理。

最佳论文说了啥?

据悉,这篇NeurIPS 2024第六高分的论文(7,8,8,8)是田柯宇在字节跳动商业化技术部门实习期间,与团队合作发表的,题目为《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》(视觉自回归建模:通过Next-Scale预测生成可扩展图像)。

该研究重新定义了图像上的自回归学习,采用了从粗到细的“下一个尺度预测”或“下一个分辨率预测”的方法,而非传统的光栅扫描“下一个token预测”。这种多尺度的方法不仅模拟了人类感知图像的过程,即先捕获全局结构再逐步添加局部细节,而且在多个方面超越了当前主流的扩散模型。

根据论文报告,在ImageNet 256×256条件生成基准测试中,新模型——视觉自回归建模(VAR),将Fréchet Inception距离(FID)从18.65降低到了1.73,并且Inception得分(IS)从80.4提高到了350.2。此外,推理速度提高了20倍,展示了显著的性能提升和效率改进。

值得注意的是,VAR模型还在数据效率、零样本泛化能力以及下游任务应用等方面表现优异。例如,在图像修复、外延和编辑等任务中也展现了其价值。为了进一步推动这一领域的研究,田柯宇团队已将所有模型和代码开源至GitHub平台,获得了超过4.4k的星标关注。

尽管田柯宇因早前对实习公司的恶意攻击行为而面临法律诉讼,此次获奖无疑彰显了他的学术才能和技术实力。此事件也引发了关于个人行为与职业成就之间关系的讨论。

责编:Demi
阅读全文,请先
您可能感兴趣
尽管2024年韩国展现出了强劲的出口表现,但2025年其出口形势可能会有所逆转。这主要受限于韩国政治形势对一系列产业政策的影响,以及美国对华提升关税和中国同业者的竞争。
Lunar Lake真的做到了长续航吗?我们上手体验了一下...
​​​​​​​本文探讨了当今最前沿的无线和物联网(IoT)技术,并预测了这些技术在未来50年的发展方向。
2024年,AI技术在移动设备、个人电脑和汽车智驾等领域飞速发展,成为多个领域中创新与发展的核心驱动力。作为全球重要的电子与半导体市场,中国在“Feature+AI”的端侧应用中也取得了显著成就。展望2025年,中国半导体行业有望在端边侧AI技术上取得突破性进展。
前不久Intel发布了最新的Arc B580显卡,我们拿它和上代旗舰以及隔壁的竞品比了比,包括游戏、AI等应用...
2024年,AI行业不仅迎来了前所未有的资本热潮,更在技术创新和场景落地上取得了跨越式突破。这或许是即将过去的一年,风险资本青睐AI技术的重要原因。
本研究通过设计闪存存算一体架构,有效提升了计算效率和精度,为解决复杂计算任务提供了重要技术支撑。
日本两大全球汽车集团本田与日产于2024年12月23日宣布启动合并谈判,目标在2025年6月达成协议,三菱汽车也有望加入。若三家车厂顺利合并,当务之急将是整合各自的资源以节省开支,利用规模化生产降低成本,以及加快电动车相关计划......
芯联集成与广汽埃安共建联合实验室,将共同推动汽车半导体技术研发创新,为智能电动汽车注入新活力。
美芯晟最新推出全集成精确直接飞行时间测距的dToF传感器MT3801,基于单光子飞行时间进行精确测距,测距范围支持到5m,同时集成SPAD、算法处理模块、Cortex M0内核和940nm VCSEL及光学滤光片,可广泛应用于手机/Pad、扫地机、吹风机、水龙头、智能马桶、投影仪、无人机等领域。
芝能汽车出品2024年的最后一周销量● 乘用车总量:周度销量 62.69 万,周度销量同比下降 17.95%,周度环比下降 4.58%,年度累计销量 2273.09 万,年度累计同比增长 7.53%。
点击左上角“锂电联盟会长”,即可关注!在锂离子电池中,正极材料是决定电池能量密度和安全性的主要因素。市场上常见的LIBs正极材料包括层状结构的LiCoO2和三元正极材料(LiNi1-x-yCoxMny
在科技领域蓬勃发展的 2025 年伊始,洛微科技(LuminWave)正式宣布获得北京电控光电融合基金战略投资,并完成B1轮融资首关,成为本年度激光雷达行业以及光电融合产业领域的开篇力作,犹如一颗闪耀
对于点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年1月1日,比亚迪发布2024年12月产销快报,数据显示,2024年12月比亚迪的销量为51.48万辆,2024年全年销量为42
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2024年12月29日,奇瑞风云A8L皖赣大区举行了上市暨感恩团购会,风云A8L已低至9.49万元。此次,风云A8L共推出5款车型,1.5L
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,1月2日,赛力斯集团董事长(创始人)张兴海向全体员工发布题为《一个目标干到底》的新年寄语。张兴海指出,2024年是具有里程碑意义、转折性意义
产品图文&视频1.揭秘OTN 400G为中国移动OTN 400G项目用户定制编写,内容包括中兴通讯OTN 400G热点词条。旨在通过简洁、趣味、轻松的文字和图片,给用户传递相关的知识和信息,帮助用户在
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年1月2日,网传一张聊天记录显示,极越汽车“创业2.0”要来了。消息称,1、夏老板(极越汽车CEO夏一平)来开会组建2.0团队,各部
点击上方“C语言与CPP编程”,选择“关注/置顶/星标公众号”干货福利,第一时间送达!最近有小伙伴说没有收到当天的文章推送,这是因为微信更改了推送机制,导致没有星标公众号的小伙伴刷不到当天推送的文章,
点击左上角“锂电联盟会长”,即可关注!市场有消息称,比亚迪12月15日临时决定率先启动磷酸铁锂招标,先于负极材料、铜箔等环节。12月18日,龙蟠科技(02465)早盘一度急升逾15%。资料显示,龙蟠科