广告

大数据催生新算法、编程语言

时间:2017-07-11 09:31:35 作者:Rick Merritt 阅读:
业界对于大数据的热烈讨论与投入,进一步催生新的算法、编程语言以及软件加速等相关技术。
广告

业界对于大数据(big data)的热烈讨论与投入,正进一步催生新的算法、编程语言以及软件加速等相关技术。

IBM首席数据官(CDO) Inderpal Bhandari指出,“神经网络(Neural network)已经存在很长一段时间了。最新的进展是我们必须为其处理大量的资料,以及强化与其有关的工程实力。”

他描述采用“生成对抗网络”(GAN)的研究进展指出,透过让两种神经网络相互竞争,可望创造出更好的神经网络。“这是一种导引出更多算法的工程思考——现在已经因此而激荡出很多关于神经网络方面的工程技术了。”

从某些方面来看,这些算法可用于预测未来的硬件。例如,Dun & Bradstreet的首席资料科学家Anthony Scriffignano指出,“量子(quantum)算法将会变得越来越热门,因为当这类算法成功可用后,就能用于执行一些量子计算机才能做的事。”

“深度信念网络”(DBN)是另一种热门的新兴途径。Scriffignano将其定义为“一种非渐进式方法,能够让你一边学习一边修正目标与目的,因而具有明日神经形态计算机的特性,”并形成一种适于仿真人脑的系统。

美国斯坦福大学(Stanford University)计算机科学教授Christopher Re开发的通用数据深度探勘工具——DeepDive算法一直备受关注。该校数据科学计划主管Stephen Eglash指出,这种算法有助于让计算机更易于了解并使用文本、表格和图表等非结构化的数据,就像掌握关系数据库或电子表格一样轻松。

“现有的数据大部份都是非结构化或半结构化的。例如,我们可以轻松地读取规格表,但计算机却很难像我们一样理解。”
20170710_bigdata_NT31P1
以一种DeepDive程序理解基于知识建构的非结构化数据 (来源:University of Wisconsin)

Deep Dive已经用于协助肿瘤学家以计算机解释肿瘤照片。此外,美国纽约检察总长也用它作为执法工具。至今,它已经应用在各个不同领域的许多公司了。

Eglash说,DeepDive之所以如此独特,部份原因在于“它能辨识并标记所有的数据,然后用学习引擎和概率技术来确定数据的意思。”

尽管这种途径十分成功,但它只是近来学术界开发的多种算法之一。其他算法有的专注于计算机视觉(computer vision)等领域,或尝试在实时数据串流中找出异常之处。Eglash强调,“如此就能让我们持续进行更深入的研究。”

掌握有趣的数据集

让开发人员肾上腺素飙高的部份原因,就在于他们必须从现实世界中取得有趣的数据集。GE Digital的Predix云端工程负责人Darren Haas声称在这方面取得了优势。

Haas说:“我想有些人可能没机会看看我们所提供的数据。我们从飞机、卫星和火车取得了高达数千兆字节(petabyte)的传感器资料。如果将这三者关联起来,就可以提供很多信息,例如农场或红杉树看起来健康或是病了。”

Hass原本任职于苹果(Apple),负责部署其中一项最大的Hadoop,用于执行像Siri等任务。他说GE Digital已经从亚马逊(Amazon)、Facebook和Google吸收到编程人才,“当我展示我们正着手进行的数据集时,他们都感到十分震惊。”

事实上,位于加州的通用电气(GE)软件部门已经从几年前约800个编程人员,迅速增加到目前约有2,000人了。

Haas个人喜欢的一种编程语言是Go。这是少数几种已编译的编程语言之一,如Elixir和Erlang一样,现在重新获得了机器学习(machine learning)开发人员的再度关注。

“在实作层,我一直鼓励自家团队使用Go,”Haas指出,GE也定期举办Go语言的聚会。“它已经过编译了、速度快、涵盖各种应用,而且更有效管理内存。我还教12岁的儿子学Go呢,因为,我认为这是未来的趋势。”

像Go这样的编译语言确实适用于执行环境。

他说:“如果您需要串流数据或事件中枢,全部都以Go来写最恰当不过了。”相形之下,“我看到的每一个Node.js项目在四个月后都得重新编写。”

也就是说,“很多人都大量使用Python。我认为它是机器学习的主流,适合数据分析、撷取数据和建构模型……等等,而且,Matlab的R也很重要。”

无论是哪一种语言,重要的发展趋势就是自动化功能。

“很多人都用数据科学家说的‘何者正确与否’,以手动策划数据集与模型。”Haas说:“但我们想用串流、侦测异常的方式进行,在封闭的反馈回路中通知用户。”

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Rick Merritt
EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞,他为EE Times撰写有关电子行业和工程专业的新闻和分析。 他关注Android,物联网,无线/网络和医疗设计行业。 他于1992年加入EE Times,担任香港记者,并担任EE Times和OEM Magazine的主编。
  • CXL,卷到何时?  CXL的目标主要是为了解决CPU和设备、设备和设备之间的内存鸿沟,解决内存分割造成的较大浪费、不便和性能下降。目前来看,高性能计算、存储加速、AI加速、大规模虚拟化,是最适于CXL应用的领域。
  • 寒武纪回应股价跳水,怒斥“假专家”言论 对于股价波动的原因,寒武纪表示,除了公司经营层面的因素外,还可能受到其他因素的影响。寒武纪还提醒投资者,应甄别信息来源,具体情况以公司公告为准。
  • 英伟达及微软被初创企业Xockets指控侵权,且违反反垄断法 Xockets认为,英伟达凭借侵犯该企业专利的DPU产品垄断了AI GPU服务器市场,而微软则垄断了支持GPU的AI平台领域。此外,Xockets还称这两家科技公司就授权费建立了垄断同盟。
  • OpenAI CEO阿尔特曼计划在美投资数百亿美元建设AI基础设施 OpenAI认为,在美国建设更多基础设施对于推进人工智能并使其优势广泛普及至关重要。
  • 暴跌近3000亿美元!英伟达如何破解“成长的烦恼”? 英伟达的CUDA生态系统和高性能AI GPU仍将作为核心竞争力,但要支撑其像以往那样的飞速的发展态势,必然要面临更大的挑战,或者已到增长的天花板。
  • AIGC汹涌而至,CXL如何提速数据中心“运力”? CXL的内存缓存一致性不但允许CPU和加速器共享内存资源,还能实现部署新的内存层,帮助弥合主内存和固态硬盘存储之间的延迟差距。这些新内存层会增加带宽的容量,提供更高效率,并降低总拥有成本。这就是业界正在坚定地将CXL作为处理器、内存和加速器的高速缓存一致性互连技术的根本原因所在。
  • 全球折叠屏手机快速增长,中国品牌压 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 奕斯伟计算DPC 2024:发布RISAA(瑞 奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
  • 重磅发布:Canalys 2024年中国云渠道 2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
  • 路特斯的努力有多“韧性” 文|沪上阿YI路特斯如今处在一个什么样的地位?吉利控股集团高级副总裁、路特斯集团首席执行官冯擎峰一直有着清晰的认知:“这个品牌的挑战依然非常大。首先,整个中国市场豪华汽车整体数据下滑了30%~40%,
  • 又一芯片大厂终止研发! ‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
  • 银河E5和小鹏MONAM03开门红,纯电车或将卷土重来? 文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
  • 【光电智造】机器视觉三维成像方法及应用  今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----来源:机器视觉沙龙申
  • 又一上市半导体关厂,400名员工失业 ‍‍‍‍上市PCB厂商竞国(6108)日前出售泰国厂给予陆资厂胜宏科技后,近日惊传台湾厂惊传12月前关厂,并对客户发布通知预告客户转移生產,最后出货日期2024年12月25日。至於后续台湾厂400名员
  • 骄成超声:引领超声波技术革新,助力碳化硅产业升级 8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
  • 长飞先进:与多家车企达成SiC合作,晶圆产能明年释放 8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了长飞先进等众多企业,深入了解
  • 活动邀请|华强电子产业研究所诚邀您莅临2024深圳跨境电商展览会 展位信息深圳跨境电商展览会(CCBEC)时间:2024年9月11-13日 9:30-17:30地点:深圳国际会展中心(宝安)展馆:16号馆 16D73/16D75 展位报名注册准备好“观众注册”入场二
  • 精密数据采集信号链设计中的常见难点解析 许多应用都要求采用精密数据采集信号链以数字化模拟数据,从而实现数据的精确采集和处理。精密系统设计师面临越来越大的压力,需要找到创新的办法,提高性能、降低功耗,同时还要在小型PCB电路板上容纳更高的电路
  • 下线、投产...这3个电驱动项目传最新进展 近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了