软件供应商Columbus Collaboratory已经将IBM的华生(Watson)超级计算机,藉由CognizeR软件工具整合到R程序语言中。
属于开源的R程序语言,已经获得全球数以百万计的工程师、科学家、统计学者与研究人员采用,现在能直接存取在IBM Bluemix云端服务上的Watson;至于提供R语言工具CognizeR (文末有链接可下载)的公司Columbus Collaboratory,实际上是一个由多家业者组成的生态系统,专注于汇整一个公用的开源数据库,以支持先进的数据分析与网络安全。
做为由IBM提供的首要人工智能(AI)解决方案,Watson在过去得要求每一个被开发为利用其服务的应用程序,透过人工编码呼叫(calls)其应用程序编程接口(API);而CognizeR工具透过将一系列具备安全防护功能的内建呼叫插入越来越受欢迎的R语言,简化了存取Watson的“感知AI (Cognitive AI)”功能的步骤。
对此市场研究机构IDC的感知系统暨内容分析研究员David Schubmehl接受EE Times访问时表示,以上信息的重要性在于,有越来越多人开始采用像是R语言这样的标准统计套件(statistical packages),而对于利用IBM云端服务BlueMix 进行的建模与深度学习任务,Watson的API服务也已经成为一个可行选项。
他指出:“R语言用户可以利用Watson API进行文本分析(text analytics),并在非结构化信息(unstructured information)中进行筛选,而不是像目前这样,只能存取结构化的信息。”
IBM估计,今日全球有90亿台连网设备、每天产生2.5 Quintillion bytes的新信息;而IDC则预期,到2020年,世界上每一个人平均将在每秒产生1.7 megabytes大小的非结构性信息,例如在线聊天内容、电子邮件、社交网络信息、影像以及文件档案;但目前这些资料只有不到1%的比例能被分析并且利用,而能挖掘更多这类非结构性数据的内容,将会是填补数据分析鸿沟的重要关键。
藉由在益智问答节目Jeopardy中胜出,Watson证明了它能够以高于人类的速度,筛选内存中的非结构性数据;而Watson已经跃上云端,成为从超级计算机到智能手机等各种设备都能够存取的服务。最终Watson的完整AI功能应该都能添加至CognizeR工具中,但第一版只会支持其语言翻译、个性分析、声调分析,以及语音/文字转换、视觉辨识等算法。
CognizeR下载地址:http://www.github.com/ColumbusCollaboratory/cognizeR
编译:Judith Cheng
本文授权编译自EE Times,版权所有,谢绝转载
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。