SIGGRAPH2023|初创企业借助NVIDIANeMo撰写生成式AI的成功案例

原创 英伟达NVIDIA中国 2023-08-10 20:05

“Writer”利用 NVIDIA AI 软件构建的大语言模型(LLM)帮助数百家公司创建内容。




机器学习帮助 Waseem Alshikh 在大学里读完了课本。如今,他正在利用生成式 AI 为数百家公司创建内容。


在叙利亚出生和长大的 Alshikh 不会说英语,但他精通软件。他在黎巴嫩上大学期间,将这一天赋发挥得淋漓尽致。


他回忆道:“第一天他们就给了我一摞课本,每本都有上千页厚,而且全是用英语写的。”


于是,他编写了一个粗糙但有效的统计分类器程序来生成这些课本的内容摘要,然后进行学习。


从提出概念到创业


2014 年,他向在迪拜工作时结识的企业家 May Habib 分享了自己的故事。他们一拍即合,决定创办一家初创企业,帮助总是要求“事半功倍”的营销部门利用机器学习快速创建网页、博客、广告等内容。


Alshikh 在该初创企业担任首席技术官。他表示:“最初我们无法实现这种技术。直到 Transformer 模型发布后,我们才基于此构建了这种技术。”


Writer 联合创始人、首席执行官 Habib 

和首席技术官 Alshikh


“我们找了几位工程师,花了近六个月的时间建立了我们的第一个模型。这是一个几乎无法运行的神经网络,拥有约 1.28 亿个参数。”参数数量是衡量 AI 模型能力的常用指标。


一路走来,这家年轻的公司逐渐赢得了一些业务,更名为 Writer,并与 NVIDIA 建立了联系。


驶入快车道


他表示:“在开始使用 NVIDIA NeMo 后,我们就能够建立行业级模型了,参数量从 30 亿个增加到 200 亿个,再到现在的 400 亿个,而且还在不断扩大。”


NeMo 是一个可以帮助企业整理其训练数据集、构建和定制大语言模型(LLM),并在生产中大规模运行这些模型的应用框架。从韩国到瑞典,世界各地的企业都在使用它来定制本地语言和行业的大语言模型(LLM)。


Alshikh 表示:“在使用 NeMo 之前,我们需要四个半月的时间来构建一个新的十亿级参数模型。而现在我们只需要 16 天就能完成,这真令人难以置信。”


模型带来机遇


今年上半年,这家初创企业不到 20 名的 AI 工程师团队利用 NeMo 开发了 10 个模型,每个模型都有超过 300 亿个或更多的参数。


这带来了巨大的机遇。现在,已经有数百家企业在使用 NeMo 为金融、医疗、零售和其他垂直市场定制的 Writer 模型。


Writer 的 Recap 工具可根据采访

或活动录音制作书面摘要


这家初创企业的客户包括德勤、欧莱雅、财捷、优步等家喻户晓的 500 强企业。


Writer 使用 NeMo 取得的成功仅仅是故事的开始。目前,已经有数十家其他公司下载了 NeMo。


这款包含在 NVIDIA AI Enterprise 中的软件将很快可供使用。NVIDIA AI Enterprise 是一套专为加速生成式 AI 工作负载而优化,并以企业级支持、安全性和应用编程接口稳定性为保障的全栈式软件。


Writer 为企业用户提供全栈式平台


每月一万亿次 API 调用


一些客户在自己的系统或云服务上运行 Writer 的模型,另一些客户则要求 Writer 托管模型或者使用 Writer 的 API。


Alshikh 表示:“我们的云基础设施基本上由两个人管理,每月托管的 API 调用达万亿次,每秒生成 90,000 个单词。我们提供的高质量模型可以与团队规模更大、预算更多的公司所提供的产品相媲美。”


NVIDIA NeMo 支持从数据整理

一直到推理的整个端到端生成式 AI 流程



Writer 使用与 NeMo 打包在一起的 Triton 推理服务器为其客户在生产中运行模型。Alshikh 表示,许多运行 LLM 的公司都在使用 Triton。与其他程序相比,Triton 可实现更低的延迟和更高的吞吐量。


“这意味着你可以将运行一些服务的成本从 10 万美元减少到 2 万美元,这样就能够投入更多资金构建有意义的功能。” Alshikh 说道。


广阔的视野


Writer 还是 NVIDIA 初创加速计划https://www.nvidia.cn/startups/)的成员,该计划旨在培育前沿初创企业。Alshikh 表示:“多亏了 NVIDIA 初创加速计划,我们才有机会尽早使用 NeMo,还有一些了不起的人指导我们如何寻找和使用所需的工具。”


如今,Writer 的文本产品已经开始受到关注,Alshikh 在佛罗里达州和加利福尼亚州两地奔波,探寻接下来的发展方向。在生成式 AI 这片广阔的“疆域”,他看到了图像、音频、视频、3D 等领域的机遇,而且这些机遇可能会同时出现。


他表示:“我们认为多模态是未来的趋势”。


此页面https://developer.nvidia.com/nemo)了解如何开始使用 NeMo。访问此页面https://developer.nvidia.com/nemo-framework-open-beta)了解多模态 NeMo 的抢先体验计划。


如果您喜欢这篇文章,请使用以下 Writer 建议的摘要转发给社交网络上的朋友:


“了解初创企业 Writer 如何利用 NVIDIA NeMo 软件为数百家公司生成内容,并以少量人员和预算获得可观的收入。”


SIGGRAPH 2023 

NVIDIA 精彩发布


【1】SIGGRAPH 主题演讲:NVIDIA 首席执行官带来生成式 AI 多项创新
【2】SIGGRAPH 2023 | NVIDIA 发布新一代 GH200 Grace Hopper 超级芯片平台
【3】 SIGGRAPH 2023 | NVIDIA 发布支持生成式 AI 与 OpenUSD 的重大 Omniverse 升级
【4】SIGGRAPH 2023 | NVIDIA Omniverse 开启通往 OpenUSD 广阔天地的大门
【5】SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展
【6】SIGGRAPH 2023 | NVIDIA 与全球工作站厂商共同推出用于生成式 AI、LLM 开发、内容创作和数据科学的系统
【7】SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企业加速采用自定义生成式 AI
【8】SIGGRAPH 2023 | NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

更多精彩,仍在继续... 

敬请持续关注



点击 “阅读原文”,或扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲回放了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。

评论
  • 本文介绍Android系统主板应用配置默认获取管理所有文件权限方法,基于触觉智能SBC3588行业主板演示,搭载了瑞芯微RK3588芯片,八核处理器,6T高算力NPU;音视频接口、通信接口等各类接口一应俱全,支持安卓Android、Linux、开源鸿蒙OpenHarmony、银河麒麟Kylin等操作系统。配置前提在配置前,建议先将应用配置成系统应用,不然配置后系统每次重启后都会弹窗提示是否获取权限。应用配置成系统应用,可参考以下链接方法:瑞芯微开发板/主板Android系统APK签名文件使用方法
    Industio_触觉智能 2025-03-12 14:34 54浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 27浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 146浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 50浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 43浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 92浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦