【光电智造】Transformers基础知识+环境安装

今日光电 2025-03-18 18:05

今日光电


     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!


----追光逐电 光引未来----

一、常见自然语言处理任务
类别
简介
情感分析
对给定的文本分析其情感极性文本生成:根据给定的文本进行生成
命名实体识别
标记句子中的实体
阅读理解
给定上下文与问题,从上下文中抽取答案
掩码填充
填充给定文本中的掩码词
文本摘要
生成一段长文本的摘要
机器翻译
将文本翻译成另一种语言
特征提取
生成给定文本的张量表示
对话机器人
根据用户输入文本,产生回应,与用户对话
二、自然语言处理的几个阶段
  • 第一阶段:统计模型+数据(特征工程)

    决策树、SVM、HMM、CRF、TF-IDF、BOW


  • 第二阶段:神经网络+数据

    Linear、CNN、RNN、GRU、LSTM、Transformer、Word2vec、Glove


  • 第三阶段:神经网络+预训练模型+(少量)数据

    GPT、BERT、ROBERTa, ALBERT、BART、T5


  • 第四阶段:神经网络+更大的预训练模型+Prompt

    ChatGPT、Bloom、LLaMA、Alpaca、Vicuna、MOSS、文心一言、通义千问、星火


图片

三、Transformers及相关库

  • Transformers:

     核心库,模型加载、模型训练、流水线等

  • Tokenizer:

    分词器,对数据进行预处理,文本到token序列的互相转换。

  • Datasets:

    数据集库,提供了数据集的加载、处理等方法

  • Evaluate:

    评估函数,提供各种评价指标的计算函数

  • PEFT:

    高效微调模型的库,提供了几种高效微调的方法,小参数量动大模型

  • Accelerate:

    分布式训练,提供了分布式训练解决方案,包括大模型的加载与推理解决方案Optimum:优化加速库,支持多种后端,如Onnxruntime、OpenVino等

  • Gradio:

    可视化部署库,几行代码快速实现基于Web交互的算法演示系统

四、Ubuntu Transformers环境安装

  • 关于miniconda、pytorch、cuda、cudnn等基础环境的安装参考下述链接:

https://blog.csdn.net/sinat_40587853/article/details/128631190
  • 对于cuda等的版本选择,依据此流程进行:显卡型号 -> 算力 -> CUDA -> 驱动 -> cuDNN,Nvidia驱动安装链接如下:NVIDIA驱动安装

图片

  • miniconda 安装下载地址:

https://mirrorstuna.tsinghua.edu.cn/anaconda/miniconda/

如果C盘有空间,最好安装在C盘,且安装目录中不能有中文。安装时勾选"将其添加到PATH"

  • conda环境创建:

conda create -n transformers python=3.9

注意:明确指定版本,否则可能会因版本过高导致有包装不上

  • pypi配置国内源-清华源,配置后下载速度起飞:

https://mirrors.tuna.tsinghua.edu.cn/help/pypi/
  • 配置pypi指令:如果您到 pip 默认源的网络连接较差,临时使用本镜像站来升级 pip:

python -m pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple --upgrade pip
  • 配置pypi指令:升级 pip 到最新的版本后进行配置:

python -m pip install --upgrade pippip config set global.index-url https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
  • pytorch安装:

  • 官方地址:https://pytorch.org/

    • 在一个单独的环境中,能使用pip就尽量使用pip,实在有问题的情况,例如没有合适的编译好的系统版本的安装包,再使用conda进行安装,不要来回混淆;

    • 30XX、40XX显卡,要安装cu11以上的版本,否则无法运行;

    • CUDA是否要安装:如果只需要训练、简单推理,则无需单独安装CUDA,直接安装pytorch;如果有部署需求,例如导出TensorRT模型,则需要进行CUDA安装。

    • Transformers核心包安装命令:

    pip install transformers datasets evaluate peft accelerate gradio optimum sentencepiece
    pip install jupyterlab scikit-learn pandas matplotlib tensorboard nltk rouge
    五、Demo测试:
    #样例:阅读理解#导入gradioimport gradio as gr#导入transformers相关包from transformers import#通过Interface加载pipeline并启动阅读理解服务gr.Interface.from pipeline(pipeline("question-answering", model="ue

    来源:新机器视觉


    申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。



    ----与智者为伍 为创新赋能----


    【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
    诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
    投稿丨合作丨咨询

    联系邮箱:uestcwxd@126.com

    QQ:493826566



    评论 (0)
    • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
      贴片加工小安 2025-04-29 14:59 164浏览
    • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
      虹科汽车智能互联 2025-04-28 16:00 153浏览
    • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
      华尔街科技眼 2025-04-28 21:55 121浏览
    • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
      用户1742991715177 2025-04-29 18:28 168浏览
    • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
      百佳泰测试实验室 2025-04-30 13:28 170浏览
    • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
      广州唯创电子 2025-04-30 09:02 151浏览
    • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
      华尔街科技眼 2025-04-30 12:40 146浏览
    • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
      广州铁金刚 2025-04-30 15:24 137浏览
    • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
      贞光科技 2025-04-28 16:52 200浏览
    • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
      锦正茂科技 2025-04-30 13:08 134浏览
    我要评论
    0
    0
    点击右上角,分享到朋友圈 我知道啦
    请使用浏览器分享功能 我知道啦