人工智能轻松学 | AI算法连载04：数学基础之蒙特卡洛方法与MCMC采样-电子工程专辑

 不懂算法的工程师做不了AI，不懂算法的产品经理将把AI带入泥潭。蒙特卡洛方法与MCMC采样是一种随机采样方法，蒙特卡罗原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。

一、前言

在人工智能AI如火如荼的大潮下，越来越多的工程师们意识到算法是AI的核心。而面对落地的应用，不懂算法的AI产品经理将是空谈，不仅无法与工程师沟通，更无法深刻理解应用的性能与方式。所以业界逐渐形成一种共识：

不懂算法的工程师做不了AI，不懂算法的产品经理将把AI带入泥潭。

而其实，AI算法没有想象的那么难，为此，机器人网整理了一整套AI算法知识，包括：

从最基本的数学基础，譬如线性代数、概率论、牛顿法等数值计算、蒙特卡洛方法与MCMC采样等；

到统计学，如：机器学习、向量、贝叶斯定理、决策树、梯度、模型评估、降维、聚类、边际、模型等等；

再到深度学习，如：前馈神经网络、反向传播算法、卷积升级网络、CNN图片分类、循环神经网络等等；

以及自然语言处理NLP等等；

还有AI算法中的各种工具和模型。

我们将把这些AI基础理论和算法以连载的形式在机器人网公众号和网站上发布，供AI爱好者免费学习。

本次连载将历时一月有余，通过这一个月的学习，AI初学者也将可能跃变成AI大神，进入未来二十年科技的金字塔尖。

当然，这需要你的坚持、专注，和努力。感兴趣的同学可以关注我们，并加微信（Aspencore6）入群分享交流。

二、理论理解与数学基础

蒙特卡洛方法与MCMC采样

作为一种随机采样方法，马尔科夫链蒙特卡罗（Markov Chain Monte Carlo，以下简称MCMC）在机器学习,深度学习以及自然语言处理等领域都有广泛的应用，是很多复杂算法求解的基础。比如分解机(Factorization Machines)推荐算法，还有受限玻尔兹曼机（RBM）原理总结，都用到了MCMC来做一些复杂运算的近似求解。

从名字我们可以看出，MCMC由两个MC组成，即蒙特卡罗方法（Monte Carlo Simulation，简称MC）和马尔科夫链（Markov Chain ，也简称MC）。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗方法和马尔科夫链的原理。

蒙特卡罗原来是一个赌场的名称，用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法，这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。

蒙特卡罗方法的关键是得到 $x$ 的概率分布。如果求出了 $x$ 的概率分布，我们可以基于概率分布去采样基于这个概率分布的n个 $x$ 的样本集，带入蒙特卡罗求和的式子即可求解。但是还有一个关键的问题需要解决，即如何基于概率分布去采样基于这个概率分布的n个 $x$ 的样本集。

不过很多时候，我们的 $x$ 的概率分布不是常见的分布，这意味着我们没法方便的得到这些非常见的概率分布的样本集。那这个问题怎么解决呢？

对于概率分布不是常见的分布，一个可行的办法是采用接受-拒绝采样来得到该分布的样本。既然 $p (x)$ 太复杂在程序中没法直接采样，那么我设定一个程序可采样的分布 $q (x)$ 比如高斯分布，然后按照一定的方法拒绝某些样本，以达到接近 $p (x)$ 分布的目的，其中 $q (x)$ 叫做 proposal distribution。

整个过程中，我们通过一系列的接受拒绝决策来达到用 $q (x)$ 模拟 $p (x)$ 概率分布的目的。

使用接受-拒绝采样，我们可以解决一些概率分布不是常见的分布的时候，得到其采样集并用蒙特卡罗方法求和的目的。但是接受-拒绝采样也只能部分满足我们的需求，在很多时候我们还是很难得到我们的概率分布的样本集。比如：

1）对于一些二维分布 $p (x, y)$ ，有时候我们只能得到条件分布 $p (x | y)$ 和 $p (y | x)$ 和,却很难得到二维分布 $p (x, y)$ 一般形式，这时我们无法用接受-拒绝采样得到其样本集。

2）对于一些高维的复杂非常见分布 $p (x_{1}, x_{2}, . . ., x_{n})$ ，我们要找到一个合适的 $q (x)$ 和 $k$ 非常困难。

从上面可以看出，要想将蒙特卡罗方法作为一个通用的采样模拟求和的方法，必须解决如何方便得到各种复杂概率分布的对应的采样样本集的问题。而我们下一篇要讲到的马尔科夫链就是帮助找到这些复杂概率分布的对应的采样样本集的白衣骑士。下一篇我们将总结马尔科夫链的原理。

三、具体算法

本文理论部分部分引用了刘建平Pinard的博客：https://www.cnblogs.com/pinard/p/6625739.html。

本文算法部分作者华校专，曾任阿里巴巴资深算法工程师、智易科技首席算法研究员，现任腾讯高级研究员，《Python 大战机器学习》的作者。这是作者多年以来学习总结的笔记，经整理之后开源于世。考虑到出版时间周期较长，而且书本购买成本高不利于技术广泛传播，因此作者采取开源的形式。笔记内容仅供个人学习使用，非本人同意不得应用于商业领域。

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

Challey

资深产业分析师

进入专栏

机器人

返回列表

上一篇： CCF-GAIR全球人工智能与机器人峰会今日开幕！打造人工智能领域顶级跨界交流合作平台 下一篇： 人工智能作恶又一案例：乔碧萝殿下就是个AI人设，也许自始至终都没有真人！

美国众议院通过法案，限制大疆无人机在美销售大疆在美国市场占据超过半数的份额，因此，这项法案如果生效，将会对美国大量无人机使用者和救援机构的业务展开产生重大影响。
这家被OpenAI看好的挪威机器人企业推出人形机器人，可包揽所有家务目前，人形机器人的发展前景也被看好。中信证券预计，2025年全球人形机器人出货将达到1万台。而根据Data Bridge Market Research的分析，全球人形机器人市场规模预计将从2023年的24.6亿美元增至2031年的558亿美元，复合年增长率为48.5%。
小鹏汽车自研智能驾驶芯片流片成功，一颗顶友商三颗据36氪汽车等多家媒体报道，小鹏汽车自研的智能驾驶芯片专为AI需求和端到端大模型设计，具备强大的中央计算架构能力。该芯片的AI算力接近3颗主流智驾芯片的水平……
先楫HPM6E00: 国内首款获得EtherCAT官方授权的MCU 先楫HPM6E00系列是中国首款拥有德国倍福公司（Beckhoff）正式授权 EterhCAT从站控制器（ESC: EtherCAT Slave Controller）的高性能MCU产品，也是国内首款支持高性能运动控制和多协议工业以太网的产品。
进迭时空SpacemiT Key Stone K1：全球首款8核RISC-V AI CPU SpacemiT Key Stone K1基于进迭时空自研的X60智算核打造，是全球首款8核RISC-V AI CPU，也是全球首款支持RVA22 Profile、支持256 bit RVV 1.0标准的RISC-V CPU，提供2倍于Neon的SIMD并行处理算力。
被苹果纳入机器人供应链名单，鸿准负责桌上机器人相关开发此前，鸿准曾负责在制造、组装鸿海自用的“FoxBot”机器人，为其与苹果合作生产桌面机器人提供了基础。
Omdia ：2024年生成式AI软件市场将增许多拥有大型语言模型（LLM）的供应商的收入运行率表明，2024 年的收入增长将达到三位数……
IDC首测8款最热门移动端大模型，3款本次报告的测评涵盖了市面上最热门的八个Chatbot App：kimi智能助手、豆包、海螺AI、天工、通义、文心一言、讯飞星火以及智谱清言（按照公司拼音首字母顺序排列）。
合见工软与Vector维克多深化战略技合见工业与维克多汽车技术（上海）有限公司共同宣布，双方在汽车电子分布式虚拟仿真测试项目上展开深入合作，通过合见工软虚拟原型设计与仿真工具套件UniVista V-Builder/vSpace，成功将Vector SIL Kit与CANoe结合，构建了全虚拟Level4级的vECU分布式仿真系统，有效提升了系统验证场景并改善测试效率。
安全为锚，合见工软发布国产自研工业创新专业的工业安全分析平台UniVista RaSA是国产自研的针对工业安全分析的EDA软件工具，可提供安全架构设计、功能安全分析/设计/实现/验证等强大功能，保障智能汽车、eVTOL、智能机器人、航空航天、智能电网、轨交、医疗器械、重型机器等工业领域的电子系统开发测试运营场景所需的更高效、更可靠、更安全的需要。

嵌入式精彩论坛抢先看！！！内容源自：慕尼黑华南电子展推文慕尼黑华南电子展(electronica South China)将于2024年10月14-16日在深圳国际会展中心(宝安新馆)举办。本届现场将继续举办一系列丰富多彩的论
Linux应用程序中终止进程的几种方法点击上方蓝色字体，关注我们在 Linux 应用程序中，终止进程的方式有多种，通常取决于进程是否需要进行正常退出或者处理异常情况。常用的方法包括 exit()、_exit()、_Exit() 和 abo
【全新升级】国产网表级功耗分析EDA大幅提升精度与性能点击蓝字关注我们“ 英诺达隆重推出EnFortius® GPA V24.08版本，新增波形重放（Waveform Replay）功能，大幅提高功耗分析精度与效率，新版本同时增加了对毛刺功耗的分析，进
剖解企业AI大模型建设路径，提升未来核心竞争力 AI大模型时代的到来，让很多企业都感受到了技术发展的魅力，但由于当前大环境，越来越多的企业对于IT的投入会更加谨慎，而根据过往经验，企业落地AI大模型确实会遇到一些问题，本文主要从大模型的建设路径与2
报名倒计时7天！SiemensEDAForum（上海免费）|AIEDA工具、汽车芯片、高端复杂芯片、3DIC等
白露为霜白露为霜唐·颜粲悲秋将岁晚，繁露已成霜。遍渚芦先白，沾篱菊自黄。应钟鸣远寺，拥雁度三湘。气逼襦衣薄，寒侵宵梦长。满庭添月色，拂水敛荷香。独念蓬门下，穷年在一方。
PPT分享：拉扎维Low-PowerSERDESDesign EETOP专注芯片、微电子，点击上方蓝字关注我们EETOP网友分享的拉扎维 Low-Power SERDES Design PPThttps://bbs.eetop.cn/thread-580435-
【限时福利】电子工程师的宝藏电子书库开放领取！末尾免费领取亲爱的电子工程师们，是不是在寻找提升技能的资源？我们为您精心准备了一系列专业电子书，涵盖：EMC（电磁兼容）：深入理解电磁干扰的控制与合规。仿真技术：掌握前沿仿真工具，优化电路设计。信号完
AI如何实现各行各业的个性化客户服务体验如今，各行各业的客户服务部门都面临着呼叫量增加、客服人员流失率高、人才短缺以及客户期望不断变化等挑战。客户希望既能有自助选项，也有人工客服提供实时支持。这种对无缝、个性化体验的期望，延伸到了各种数字通
越来越“热”的芯片，如何降温？前言：2024年，AI的“狂飙突进”势头不减，继ChatGPT之后，文生视频大模型 Sora 的推出更是让人们看到AI的无限可能。然而，随之而来的能耗问题也不容忽视。国际能源署（IEA）《Electr

热门评论
最新评论

换一换

人工智能轻松学 | AI算法连载04：数学基础之蒙特卡洛方法与MCMC采样

一、前言

二、理论理解与数学基础

三、具体算法

杂志声明