Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

OpenCV学堂 2025-03-26 22:42

点击上方↑↑↑OpenCV学堂”关注我

来源:公众号 新智元 授权

图片

【导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2,它们各有优劣,为科研人员提供了多样选择。

几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。
从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。
但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
在这里,研究人员与《自然》杂志分享了他们当下最青睐的模型。

o3-mini:推理小能手


提到LLM,就不得不提OpenAI。2022年,OpenAI推出了聊天机器人ChatGPT。

科学家们主要将ChatGPT用于查找信息或作为写作助手,如起草摘要等。而在去年,OpenAI又发布了一系列更先进的模型,其中o3-mini就是一款非常出色的推理模型。

o3-mini是一款速度很快的推理模型,并且面向注册用户免费开放。它经过训练,会以逐步推理的方式回答问题。

这种「思维链」旨在模拟人类推理过程,帮它在科学和数学领域突破了严苛的基准测试。o3-mini擅长处理技术任务,如解决编程问题和重新格式化数据。

牛津大学数学家兼AI研究人员Simon Frieder表示,在解析陌生数学证明等任务上,o3-mini表现非常出色。

不过,他也提到,o3-mini仍然无法与数学家媲美。但不可否认的是,o3-mini为科研人员在处理一些复杂问题时提供了有力的帮助。

OpenAI近期还推出了「深度研究」功能,允许一些付费订阅用户从数百个网站上综合信息并添加引用,生成报告,进行文献综述。

旧金山初创公司FutureHouse的化学家兼AI专家Andrew White表示:「这些模型在组合使用时效果更佳。」

DeepSeek:全能「潜力股」

DeepSeek-R1也是一款备受瞩目的模型。它的能力与OpenAI的o1相当,但通过API使用的成本却低得多。这对于许多科研团队来说,是一个很有吸引力的优势。

DeepSeek-R1是开源权重模型,虽然其训练数据尚未公布,但任何人都可以下载基础模型,并根据自己的研究项目进行定制。

香港中文大学(深圳)的计算机科学家Benyou Wang等人正在开发可以在单机上运行或训练的版本,让更多学者能用到这个强大的模型。

和o1一样,DeepSeek-R1的强项是解决数学问题和编写代码。同时,它在提出假设等任务上也表现不错。这是因为DeepSeek选择公布模型的「思考过程」,使得研究人员能够更好地完善后续问题,提高模型的输出质量。

这种透明度在医学诊断领域也可能发挥巨大作用。Benyou Wang正在利用该模型的推理能力开展实验,致力于构建从患者评估到诊断和治疗建议的清晰路径。

然而,DeepSeek-R1也并非完美无缺。该模型的「思考过程」似乎特别长,这降低了它的运行速度,在查找信息或头脑风暴方面实用性欠佳。
与竞争对手相比,DeepSeek在防范模型生成有害内容方面所采取的措施似乎也较少。一些研究人员认为这种开源且功能强大的模型对于科研发展有着重要意义,而另一些人则对此持谨慎态度。

Llama:科研老伙计


Llama是Meta AI于2023年发布的一组开源权重模型,长期以来一直是科研界常用的LLM。仅通过开源科学平台Hugging Face,Llama各个版本下载量就已超过6亿次。

Llama之所以受到科研界的欢迎,很大程度上是因为它可以被下载并在此基础上进行开发。在处理受保护的数据时,能在个人或机构的服务器上运行至关重要,可以避免敏感信息反馈给其他用户或开发者。

研究人员基于Llama模型开发出了能预测材料晶体结构的大语言模型,还利用它来模拟量子计算机的输出结果。

北卡罗来纳大学教堂山分校的ML科学家Tianlong Chen表示,Llama很适合用于模拟量子计算机,因为相对容易对其进行调整,让它理解专业的量子语言。

不过,Llama也有一些小缺点。比如需要用户申请访问权限,这对一些人来说有点麻烦。

因此,其他开源模型,如西雅图Allen人工智能研究所开发的OLMo,以及阿里云开发的Qwen,现在常常成为科研中的首选。DeepSeek V3如今也是有力的竞争者。

Claude:编程利器


在硅谷,很多人对Claude 3.5 Sonnet的编程能力赞不绝口。

Claude 3.5 Sonnet由总部位于旧金山的AI公司Anthropic开发,它不仅可以编写代码,还能解读图表等视觉信息。此外,它还有一种模式,允许其远程操作用户的计算机。

Claude的写作风格也备受赞誉。一些LLM(如ChatGPT)在去除技术语言时,可能也会误删关键信息。而Claude在润色文本的同时,更擅长保留原意。

因此,在撰写科研基金申请或为代码添加解释性注释时,Claude可能是更好的选择。

在一项基于数据驱动的科学任务的基准测试中,Claude 3.5 Sonnet在编程挑战方面表现出色,这些任务的数据取自生物信息学和计算化学等领域的真实论文。

虽然Claude 3.5 Sonnet作为在线聊天机器人可以免费使用,但和OpenAI的模型一样,研究人员只能通过付费API,才能实现完整集成。

随着更便宜的开源模型越来越强大,人们可能会更倾向于使用开源模型。

Olmo:开源新星


对于想要深入了解内部运行机制的研究人员来说,Olmo 2是一个非常不错的选择。

Olmo 2是目前性能最出色的开源模型之一,它还附带算法的训练数据,以及用于训练和评估模型的代码。

研究Olmo 2这样的模型能让研究人员将偏差来源追溯到训练数据上,同时通过更好地理解算法如何得出输出结果,来提高效率。
目前,开源模型的门槛是需要一定的专业知识才能运行,但随着免费实践课程的增加,进入门槛正在逐渐降低。
如果法院判定使用受版权保护的内容来训练模型属于违法行为,那么像Olmo 2这样基于允许重复使用和修改的数据集所训练的模型,可能是唯一可以安全使用的模型。
参考资料:
https://www.nature.com/articles/d41586-025-00437-0

OpenCV4系统化学习

图片

推荐阅读

OpenCV4.8+YOLOv8对象检测C++推理演示

ZXING+OpenCV打造开源条码检测应用

攻略 | 学习深度学习只需要三个月的好方法

三行代码实现 TensorRT8.6 C++ 深度学习模型部署

实战 | YOLOv8+OpenCV 实现DM码定位检测与解析

对象检测边界框损失 – 从IOU到ProbIOU

初学者必看 | 学习深度学习的五个误区



图片

OpenCV学堂 专注计算机视觉开发技术分享,技术框架使用,包括OpenCV,Tensorflow,Pytorch教程与案例,相关算法详解,最新CV方向论文,硬核代码干货与代码案例详解!作者在CV工程化方面深度耕耘15年,感谢您的关注!
评论 (0)
  • 2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。以社交平台上泛滥的 AI 伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权
    用户1742991715177 2025-05-05 23:08 89浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 118浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 199浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 240浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 101浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 359浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 277浏览
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 175浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 240浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 150浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 398浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 110浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦