GenAI核心技术解析及发展趋势

智能计算芯世界 2024-06-17 07:46

本文来自“干货分享:“人工智能+”引爆新质生产力革命(2024)”,传统意义上的AI模型,主要分为判别式模型(Discriminative Models生成式模型Generative Models)。

下载链接:
《2024年中国空间计算行业概览合集》
1、2024年中国空间计算行业概览(1):空间计算先行,软硬件内容生态共振 
2、2024年中国空间计算行业概览(Ⅱ):空间计算设备产业链拆解(摘要版)
干货分享:“人工智能+”引爆新质生产力革命(2024)
模型即服务:MaaS框架与应用研究报告(2024年)
《Computex 2024系列主题演讲合集》
1、Computex 2024系列AMD主题演讲:CPU+GPU+UA互联厂商 
2、Computex 2024英伟达主题演讲:AI时代如何在全球范围内推动新的工业革命


判别式模型(Discriminative Models):用于解决回归或分类任务,重点在于区分不同类别的数据。与生成模型不同,判别模型不生成新数据,而是专注于学习输入特征与输出标签之间的关系,以便准确地进行分类或预测。判别式模型在各种应用中广泛使用,特别是在需要分类或回归任务的场景中,例如:BERT(用于各种NLP任务)、金融风险评估的信用评分系统(如FICO)、癌症检测系统等等。

而生成式模型(Generative Models:是生成式AI背后的技术,是一类能学习和模仿数据分布的模型,它们能够创建看起来与训练数据相当相似的新数据样本。举个例子,如果我们有一个人脸生成模型,它可以生成看起来像真人脸的图片,而这些图片与模型用来训练的真实人脸图片很相似,甚至很难区分哪个是生成的,哪个是真实的。生成式模型已被广泛应用于各种领域,特别是在需要生成新数据样本的任务中,例如:GPTDALL-E(图像生成)、DeepArtPrisma(图像风格转换)等等。

大模型是大算力+强算法结合的产物。大模型通常是在大规模无标注数据上进行训练,学习出一种特征和规则。基于大模型进行应用开发时,将大模型进行微调,如在下游特定任务上的小规模有标注数据进行二次训练,或者不进行微调,就可以完成多个应用场景的任务。

从参数规模上看,AI大模型先后经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,参数量实现了从亿级到百万亿级的突破。从模态支持上看,AI模型从支持图片、图像、文本、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务

人工智能领域中的一些重要基础技术概念如下:

1)神经网络技术(Neural Network Technology:是一种模仿生物神经系统结构和功能的计算方法。神经网络的结构通常分为输入层、隐藏层和输出层。输入层接受原始数据,隐藏层负责数据的特征提取和处理,输出层生成预测结果。神经网络技术可以处理复杂数据和任务,已在人工智能和机器学习领域中广泛应用。

2)神经符号推理(Neuro-Symbolic Reasoning结合了神经网络和符号推理的混合方法,利用两种技术的优势来解决复杂的推理和学习任务。这种方法在人工智能领域具有广泛的应用前景,因为它能够处理复杂的数据和关系,同时保留符号逻辑的可解释性和规则性。

3)尺度定律(Scaling Law是指在训练模型时,模型性能随模型规模(如参数数量)、训练数据量和计算资源的增加而变化的规律。这些定律帮助研究人员和工程师更好地理解和预测扩展模型时的效果和需求。在GPT-3的开发过程中,OpenAI遵循了尺度定律,通过大幅增加模型参数数量(达到1750亿),显著提高了模型的自然语言处理能力。而摩尔定律(Moore's Law)应用于半导体和计算机硬件领域,具体说的是当价格不变时,集成电路上可容纳的晶体管数目,每隔18个月便会增加一倍,意味着性能也将提升一倍。两个定律应用领域不同,但都体现了技术进步在各自领域内的驱动力。

4)自然语言处理技术(Natural Language ProcessingNLP:包括词法分析、句法分析、语义理解等。这些技术帮助模型更好地理解和生成自然语言文本,使得生成的文本更加准确和语义丰富。

5)大规模数据集(Dataset:海量的高质量数据是训练生成式 AI 模型的关键。这些数据集包含丰富的语言知识和模式,能够帮助模型学习到更好的表示和生成能力。

6)无监督学习算法(Unsupervised Learning:能够从数据中自动发现模式和特征,无需人工标记的监督信息。这对于生成式AI 模型的训练至关重要,可以使模型从大量未标记的数据中学习到有用的知识。

7)强化学习(Reinforcement LearningRL是一种机器学习方法,用于训练模型做出决策,以实现最佳结果。通过反复试错和奖惩制度,与环境交互来学习最优策略,有助于实现目标的软件操作会得到加强,而偏离目标的操作将被忽略,从而在不同状态下选择最佳处理路径以获得最大化预期回报。强化学习广泛应用于机器人控制、游戏AI、推荐系统等领域。例如,著名的AlphaGo在训练过程中结合了强化学习策略,以寻找最佳落子策略。

8)强化学习与人类反馈(Reinforcement Learning with Human Feedback, RLHF合强化学习的自动学习能力和人类的反馈,通过人类反馈指导学习的过程,显著加速学习速度,提高性能及安全性。强化学习与AI反馈(Reinforcement Learning with AI FeedbackRLAIF)是结合了强化学习的自动学习能力和AI模型的智能反馈。其智能体不仅从环境中获得奖励,还从另一个AI系统中获得反馈。这种方法利用AI反馈来指导和改进智能体的学习过程,从而加速策略优化,提高整体性能。

9)迁移学习(Transfer Learning是一种机器学习方法,其中一个模型在某个任务上学到的知识被应用到另一个相关的任务中。通过这种方法,迁移学习能够利用已有的经验,提高新任务的学习效率和性能。尤其是在数据有限的情况下,迁移学习能够显著提升模型性能。

10)联邦学习(Federated Learning是一种分布式机器学习方法,允许模型在多个设备或节点上训练。这种方式能够在保护数据隐私的前提下,利用分散的数据进行模型训练,可以在全局模型的基础上,进一步调整和优化个性化模型,满足不同用户的需求。

11)生成对抗网络(Generative Adversarial Networks, GAN):GAN包括两个部分:生成器和判别器。生成器尝试生成与真实数据相似的假数据,而判别器尝试区分真假数据。通过不断的对抗训练,生成器最终能够生成较为逼真的数据。

12)自回归模型(Autoregressive Model:通过前一个时刻的输出来预测下一个时刻的输出,广泛应用于文本生成和音频生成等领域。

13)变分自编码器(VAEs:由编码器和解码器组成。编码器将图片信息压缩成一潜在空间。这就像画家将复杂的画面概括成简单的草图,这个草图包含了图片的关键要素,但省略了细节。解码器根据这些草图画出新图片。就像画家根据草图创作出一幅新画。这些新画看起来像是从原始图片中生成的,但又是独一无二的。在训练过程中,VAE会不断调整编码器和解码器,让生成的图片越来越逼真。

14)优化算法(Algorithms Optimization:用于训练模型,调整模型参数以最小化损失函数,提高模型性能。常见的优化算法包括随机梯度下降(Stochastic Gradient Descent, SGD)和其变种,以及自适应学习率算法如Adam等。例如,随机梯度下降是指不使用全量样本计算当前的梯度,而是使用小批量(mini-batch)样本来估计梯度,大大提高了效率。

15)注意力机制(Attention:使模型聚焦于输入中的关键部分,提高处理效率和效果。注意力机制在生成式AI 中被广泛应用,例如用于自然语言处理任务中的注意力机制模型(如Transformer)能够有效处理长距离依赖关系和提升生成性能。

以上的这些技术在过去的20年中快速发展,直到2017年的历史性的突破Transformer到来,才有了生成式AI的基础。而在2022ChatGPT的横空出世,进一步将生成式AI型从需要大量标注数据而进行训练的时代带入到不需要标注数据而进行海量数据训练的时代。

全球人工智能图谱2024和中美 AI 实力对比

下载链接:
英伟达GPU加速迭代,聚焦AI光通信核心厂商
《Computex 2024系列主题演讲合集》
1、Computex 2024系列AMD主题演讲:CPU+GPU+UA互联厂商 2、Computex 2024英伟达主题演讲:AI时代如何在全球范围内推动新的工业革命
科技前瞻专题:国际巨头的端侧AI布局(2024)
AIoT白皮书:AI硬化向实而生
异构大规模分布式网络设计与性能评估
2024面向未来的算力网络连接:中国算力网络市场发展白皮书
2024面向AIGC的数智广电新质生产力构建白皮书
2024大模型训练数据白皮书
存储器行业:双墙阻碍算力升级,四大新型存储应用探讨
生成式人工智能专题研究:国内大模型(生成式AI加速,国内厂商聚力突破)
《存储专题系列合集》
1、存储专题系列一:新应用发轫,存力升级大势所趋 
2、存储专题系列二:存力需求与周期共振,SSD迎量价齐升 
3、存储专题三:AI时代核心存力HBM
4、存储专题:AI发展驱动HBM高带宽存储器放量
机器人专题研究:产业发展概览(2024)
国产AI算力行业报告:浪潮汹涌,势不可挡(2024)
AI系列之HBM:AI硬件核心,需求爆发增长
2024中国“百模大战”竞争格局分析报告(2024)
2024年中国虚拟现实(VR)行业研究报告

《半导体行业深度报告合集(2024)》

《70+篇半导体行业“研究框架”合集》

600+份重磅ChatGPT专业报告
《人工智能AI大模型技术合集》
《56份GPU技术及白皮书汇总》


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 127浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 100浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 111浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 66浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 172浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 79浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 209浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 122浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 161浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 74浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 95浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 126浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 227浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 145浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 96浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦