社区首页
博客
论坛
下载
文库
评测
芯语
研讨会
商城
EE直播间
芯视频
E聘
更多
社区
论坛
博客
下载
评测中心
面包芯语
问答
E币商城
社区活动
资讯
电子工程专辑
国际电子商情
电子技术设计
CEO专栏
eeTV
EE|Times全球联播
资源
EE直播间
在线研讨会
视频
白皮书
小测验
供应商资源
ASPENCORE Studio
活动
2025 中国国际低空经济产业创新发展大会
2025 第六届国际 AIoT 生态发展大会
2025 全球 MCU 生态发展大会
2025 第六届中国国际汽车电子高峰论坛
IIC Shenzhen 2025
2025国际电子商情分销与供应链行业年会
IIC Shanghai 2025
更多活动预告
杂志与服务
免费订阅杂志
电子工程专辑电子杂志
电子技术设计电子杂志
国际电子商情电子杂志
登录|注册
芯语
帖子
博文
电子工程专辑
电子技术设计
国际电子商情
资料
白皮书
研讨会
芯语
文库
首页
热门
专栏作家
电子产业热词
CEO专栏
技术文库
科技头条
专栏入驻
×
提示!
您尚未开通专栏,立即申请专栏入驻
芯语
帖子
博文
用户
芯语
登录
首页
专栏作家
CEO专栏
论坛
博客
E币商城
资讯
电子工程专辑
国际电子商情
电子技术设计
CUDA
平替CUDA!摩尔线程发布MUSA4、配套性能分析工具
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
硬件世界
2025-04-20
320浏览
平替CUDA!摩尔线程MUSA越来越强大了
在发布重量级的MUSA SDK 4.0.1开发包之后,摩尔线程又同步带来了配套性能分析工具Moore Perf System的最新版本v1.3.0。Moore Perf System是摩尔线程SDK中的基础组件,用于辅助开发者进行开发调试,可以方便、快速、准确地定位到系统级别的性能瓶颈,进而进行针对性分析和优化,使程序性能满足需求。如果需要进一步分析计算类应用程序,请使用Moore Perf Co
文Q聊硬件
2025-04-20
82浏览
全球AI系统计算平台对比:CUDA、CANN、Neuware和ROCm
本文来自“国内外AI芯片平台分析:独立自主的AI系统级计算平台是国产AI芯片构建生态壁垒的关键”,影响AI芯片计算能力的因素除了硬件层面的芯片制程、内存、带宽等,还包括调用各硬件资源的系统级软件计算平台。AI芯片厂商开发的系统计算平台不仅仅有效提升各家AI芯片产品的算力利用率,还为各类AI应用开发提供了丰富的函数库,提供开发者简便易用的开发环境。本文所有资料都已上传至“智能计算芯知识”星球。如“《
智能计算芯世界
2025-04-15
1544浏览
取代CUDA!摩尔线程重磅发布MUSA4:支持国产x86
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
硬件世界
2025-04-13
949浏览
取代CUDA!摩尔线程MUSA重磅升级:支持国产x86
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
文Q聊硬件
2025-04-13
667浏览
14.88亿元!国产GPU连续拿下AI大单还要啥CUDA
DeepSeek的火爆,给整个AI行业带来了一股新风,大模型开源,算力需求低,从打破了NVIDIA CUDA长期以来的生态垄断,大大推动了国产GPU AI芯片、系统的发展,比如沐曦就连续拿下了两份采购大单,总额达14.88亿元。2月7日,超讯通信发布公告称,与中特新联科技签订《采购合同》《采购订单》,含税总金额约8.5亿元。2月25日,超讯通信再次发布公告称,与深圳星航智算科技签订《智算集成服务采
硬件世界
2025-02-26
346浏览
14.88亿元!国产GPU连续拿下AI大单还要啥CUDA
DeepSeek的火爆,给整个AI行业带来了一股新风,大模型开源,算力需求低,从打破了NVIDIA CUDA长期以来的生态垄断,大大推动了国产GPU AI芯片、系统的发展,比如沐曦就连续拿下了两份采购大单,总额达14.88亿元。2月7日,超讯通信发布公告称,与中特新联科技签订《采购合同》《采购订单》,含税总金额约8.5亿元。2月25日,超讯通信再次发布公告称,与深圳星航智算科技签订《智算集成服务采
文Q聊硬件
2025-02-26
320浏览
绕开CUDA!DeepSeek准备适配国产GPU
DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁,而现在这件事才刚刚开始。DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Th
文Q聊硬件
2025-02-02
2336浏览
DeepSeek团队神操作:用“汇编”取代CUDA让性能狂飙!
在人工智能领域,DeepSeek 引发了巨大轰动。它借助由 2048 块英伟达 H800 GPU 组成的集群,仅用约两个月时间就完成了拥有 6710 亿参数的混合专家(MoE)语言模型训练,效率比 Meta 等人工智能行业领军企业高出 10 倍。据 @Jukanlosreve 援引韩国未来资产证券(Mirae Asset Securities Korea)的分析,这一突破得益于大量细粒度的优化措施
EETOP
2025-01-29
1316浏览
为什么英伟达如此强大?这就是CUDA的魔力
在高性能计算、游戏和人工智能处理方面,英伟达无疑是领先的竞争者,远远超过了AMD和英特尔,夺得了性能桂冠。那么,是什么使英伟达的芯片与其他厂商的芯片不同,其他厂商至今未能复制其成功呢?这个成功的关键在于并行处理——通过同时执行多个数据处理操作来提高计算速度的过程。与按顺序处理任务的多个内核的CPU(中央处理单元)不同,GPU(图形处理单元)可以利用数千个核心同时处理多个任务。这种架构优势为处理当今
EETOP
2024-11-09
432浏览
AMD将推出统一GPU架构,挑战英伟达CUDA“护城河”!
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有效地应对英伟达根深蒂固CUDA生态系统奠定基础。当AMD在2019年放弃其GCN微架构时,该公司决定将其新的图形微架构分为两种不同的设计,其中RDNA旨在为消费市场的游戏图形产品提供支持,而CDNA架
飙叔科技洞察
2024-09-10
725浏览
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权【导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与安装的PyTorch匹配!!!」而企图炸键盘
OpenCV学堂
2024-09-09
752浏览
NVIDIA招聘|欢迎加入NIM和CUDA团队,与我们共同打造AI未来的基础
01企业想要部署生成式 AI 模型,可以使用 NVIDIA 的哪一个推理微服务?点击空白处查看答案NIM02NVIDIA 在 2006 年推出的向业界开放 GPU 能力的服务是什么?点击空白处查看答案CUDA上面两个问题的答案是否与您心中所想一致呢?现在多个 CUDA 和 NIM 团队的岗位在等待您的投递!热招岗位(上海)JR1985241 Senior CUDA Test Development
英伟达NVIDIA中国
2024-08-20
556浏览
NVIDIA封杀转译兼容CUDA:AMD被迫删除代码
NVIDIA CUDA生态建设得非常繁荣,也成为其极具竞争力的护城河,自然不会允许别人随便染指,今年3月发布的CUDA 11.6版本就明确规定,不允许在非NVIDIA平台上逆向工程、反编译或反汇编CUDA SDK生成的任何结果。首当其冲被影响的就是ZLUDA项目,出自大神级开发者Andrzej Janik,只需用ZLUDA库替代CUDA即可,不需要任何转译,也不需要调整代码。ZLUDA最初通过In
硬件世界
2024-08-09
594浏览
摆脱英伟达CUDA,各家厂商积极寻求解套方法
面对当前人工智能市场的快速发展,包括AMD、英特尔等企业对此也正在积极寻求对人工智能软件公司收购、投资和合作,以进一步能与能与英伟达(NVIDIA)的CUDA竞争。英伟达全球数据中心AI芯片市占率超过90%,AI热潮使英伟达H100 AI芯片尽管价格不菲,仍供不应求。接下来 Blackwell 核心架构 GB200 GPU 仍会延续趋势。CUDA 运算架构软件被认为是英伟达拿下主导地位的主要贡献者
EETOP
2024-07-25
720浏览
打破垄断!CUDA软件可以在AMD显卡上无缝运行
英国新创公司Spectral Compute近日推出了名为“SCALE”的GPGPU编程工具包,成功实现了NVIDIA CUDA软件在AMD GPU上的无缝运行,有望打破NVIDIA在GPU计算领域的垄断地位。CUDA是NVIDIA 2007年推出的并行计算平台和编程模型,广泛应用于高性能计算和深度学习等领域。由于其与NVIDIA GPU硬件的深度绑定,CUDA生态的丰富性使得其他厂商难以竞争。S
硬件世界
2024-07-19
1318浏览
英伟达危险!CUDA护城河或被打破!
英国初创公司Spectral Compute推出了一款名为“SCALE”的GPGPU工具链,使英伟达(NVIDIA)的CUDA可以无缝运行在AMD的GPU上。据wccftech报道,英伟达的CUDA现在可以直接在AMD等非英伟达的GPU上运行,无需代码移植,这要归功于SCALE。看起来业界已经能够打破英伟达的软件栈主导地位,他们现在正在寻找通过各种手段移除其“排他性”地位的方法。之前我们看到ZLU
EETOP
2024-07-18
594浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-06-03
594浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-05-17
542浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-05-16
484浏览
字节美国专家CUDA内核编程训练营
试听群:感兴趣可以加文末试听群,免费试听第一节课。课程报名咨询请联系客服小月(WX:linuxer2016)训练营主题: CUDA内核编程训练营时长: 12 小时训练营描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍
Linux阅码场
2024-05-15
553浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-04-22
667浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-04-16
662浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-04-11
655浏览
产业丨AI芯片战火蔓延,UXL基金狙击英伟达CUDA
·聚焦:人工智能、芯片等行业欢迎各位客官关注、转发前言:随着AI芯片领域的竞争不断加剧,战火已延伸至软件生态层面。近日,英伟达公司明确宣布,禁止在其他硬件平台上通过翻译层运行基于CUDA的软件。这一举措加剧了AI软件生态的竞争态势,对行业发展产生深远影响。作者 | 方文三图片来源 | 网 络 英伟达[守]:用CUDA垄断AI芯片的核心据市场研究机构Gartner的最新预测,至2024年,AI芯片
AI芯天下
2024-04-04
766浏览
正在努力加载更多...
广告
今日
新闻
1
振动测试如何巩固电子制造的质量保证
2
深圳全景相机“卖爆”纽约!凌晨排队、疯狂抢购、非买不可
3
车载测试技术解析:聚焦高带宽、多通道同步采集与协议分析
4
中国科研团队成功将脑机接口柔性微电极植入机器人CyberSense
5
本土MCU企业2024年财报分析:消费电子复苏,车规尚在烧钱
6
英特尔:撤回一个拆分计划
7
传苹果正开发一款智能眼镜,融入Apple Intelligence技术
8
日产汽车加速收缩在华产能,武汉工厂将于明年3月停产
热门
文章排行
1
替换英伟达!传华为昇腾910C将大规模出货
芯极速
3402
2
涉及储能!两国总统同日访华,释放合作信号
行家说储能
3058
3
传中国对部分美国芯片加征关税豁免:125%降至0
52RD
2989
4
传中国对部分美国芯片加征关税豁免:125%降至0
射频美学
2496
5
传!部分美国产芯片获中国125%关税豁免
芯极速
2270
6
突发!美国宣布:加征3403.96%关税!
皇华电子元器件IC供应商
1809
7
该GaN企业完成亿元融资,产品进入小米、联想等一线厂商
第三代半导体风向
1711
8
中国第一个L3来了!华为新一代ADS4重磅发布:4大升级、4个配置
快科技
1657
9
传中国对部分美国芯片免征关税!
皇华电子元器件IC供应商
1635
10
中国对部分美国芯片加征关税豁免:125%降至0
芯片视界
1558
11
储能行业中的“五大四小”是什么?
锂电联盟会长
1522
12
重磅!华为AI芯片910C将于5月量产出货,920也在路上了!
飙叔科技洞察
1432
13
曝蔚来一智驾技术大佬离职!
谈思汽车
1128
14
发布6nm!出货16亿颗手机芯片,5G芯片应用全球76个国家,又一国产手机芯片站稳了!
飙叔科技洞察
1085
15
突发!凯盛科技子公司高管被刑事拘留
WitDisplay
1017
16
突发!传中国对部分美国芯片免征关税!
ittbank
1017
17
AMEYA360丨2025年劳动节放假通知!
皇华电子元器件IC供应商
980
18
【实战干货】7张图带你看懂PCB布线规范,不踩坑才是高手!末尾有彩蛋
凡亿PCB
944
19
第九篇:2025年上海车展展前洞察报告(终)
智能汽车设计
890
20
突发!美国宣布:加征3403.96%关税!
中国半导体论坛
835
21
华为激进!Mate80塞进大风扇,麒麟性能这下爆发了
手机技术资讯
829
22
2025上海车展前瞻报告:创新智联自主竞逐高端
智车文库
817
23
美国征收东南亚国家最高3403%关税
芯极速
794
24
泡沫正在破灭!英伟达高位下跌60%正在成为现实
美股研究社
766
25
出货量全国第一!射频芯片细分龙头拿下数亿元融资
物联传媒
751
26
2025年已发布14款MiniLED显示器
行家说Display
744
27
IDC:2025年Q1中国折叠屏手机出货增长53.1%,华为份额超75%
52RD
730
28
特斯拉专家访谈:GaN车载应用已成趋势
第三代半导体风向
697
29
传海关通知:符合条件的美产芯片豁免关税
贞光科技
689
30
OpenCV4.10DNN部署YOLO11全系模型
OpenCV学堂
686
广告
最新
评论
更多>>
学习了
青青水草
评论文章
2025-04-22
湿度正在偷偷毁掉你的基准源精度!
good,.
mhlyjay
评论文章
2025-04-22
MOS管损耗理论计算公式推导及LTspice仿真验证
资料
文库
帖子
博文
1
电源工程师技术培训-初级
2
微弱直流电压信号采集
3
车规级功率半导体技术现状、挑战与发展趋势
4
2025年感知技术十大趋势深度分析报告
5
STM32G431移植FreeModbus
6
[16章]AI Agent从0到1定制开发 全栈/全流程/企业级落地实战
7
[完结14章]RAG全栈技术从基础到精通 ,打造高精准AI应用
8
【2025新品】java-antd-web3全栈dapp开发教程
9
ASL6328 HDMI2.0 Retimer中继器ic设计说明书
10
[鸟哥的Linux私房菜:服务器架设篇(第二版)].鸟哥.扫描版
1
【2025面包板社区内容狂欢节】发文、回帖赢25万E币!
2
已知并联电阻总阻值,算出23456个......并联电阻的阻值,比...
3
差分晶振的输出方式有哪几种呢
4
【敏矽微ME32G030系列】+初识及测试开发板(外接继电器)
5
【敏矽微ME32G030系列】+初识篇
6
MacBook扩展坞怎么选?
7
IU5209E升压充电管理芯片
8
电解电容寿命能不能满足5年?固态电容的寿命是不是要更...
1
芯资讯|WTR096-16S录音语音芯片:重塑智能家居的情感连接与安全守护
2
晶振内部的污染物是哪里来的?
3
晶振有电压,但没有压差,是短路吗?
4
盘点全球十大人形机器人公司!你认识哪家?
5
协议标准第015篇 汽车48V电气标准
6
集成电路封装与测试流程详解
7
探针台在光电行业的应用
8
探针台在半导体行业的应用
1
理解功率MOSFET的RDS(ON)温度系数特性
2
什么是运算放大器?一分钟让你了解怎么用!
3
嵌入式硬件--开关电源Buck电路
4
收藏|原理图设计规范133条检查清单
5
线弧异常分析
6
电流检测,采样电阻Rshunt切换电路设计
7
简单聊无源器件与有源器件的区别
8
【电机控制】PMSM无感FOC控制-双电阻以及三电阻电流采样法
9
电子封装陶瓷基板及其金属化工艺
10
变频器跳闸保护全解析
在线研讨会
利用氮化镓技术打造高效电机驱动——人形机器人、无人机与电动汽车应用
ADMT4000重新定义多圈编码器设计
NSSine™系列实时控制MCU在数字电源和电机控制领域的应用
ST 在大功率热管理系统中的电机控制系统方案(AI 数据中心/暖通空调/电池储能系统/变频制冷)
EE直播间
中小数字IC云仿真加速方案:弹性资源与验证效率提升
直播时间:05月22日 10:00
E聘热招职位
本网页已闲置超过10分钟,按键盘任意键或点击空白处,即可回到网页
X
最新资讯
振动测试如何巩固电子制造的质量保证
深圳全景相机“卖爆”纽约!凌晨排队、疯狂抢购、非买不可
车载测试技术解析:聚焦高带宽、多通道同步采集与协议分析
中国科研团队成功将脑机接口柔性微电极植入机器人CyberSense
本土MCU企业2024年财报分析:消费电子复苏,车规尚在烧钱