Brave新世界:LeoAI和Ollama为Brave浏览器用户带来RTX加速的本地LLM

英伟达NVIDIA中国 2025-01-24 17:31


从游戏和内容创作应用,再到软件开发和生产力工具,AI 正越来越多地集成到应用中,以增强用户体验和提高效率。


这些效率提升将延伸到日常任务,如网页浏览。作为一款致力于保护隐私的网络浏览器,Brave 推出了一款名为 Leo AI 的智能 AI 助手,除提供搜索结果之外,该助手还可以帮助用户总结文章和视频,从文档中获取见解,回答问题等。


Leo AI 将帮助用户总结文章和视频,从文档中获取见解,回答问题等。


Brave 和其他 AI 赋能工具背后的技术组合了硬件、软件开发库和生态系统软件,这类软件经过优化,可满足 AI 的独特需求。


为什么软件至关重要


从数据中心到 PC,NVIDIA GPU 构建了世界的 AI。它们包含 Tensor 核心,这些核心经过专门设计,可通过大规模的并行运算来加速 Leo AI 这类 AI 应用—— 快速同步处理 AI 所需的大量运算,而不是逐次运算。


但只有当应用能够高效利用强大的硬件时,这些硬件才有意义。在 GPU 上运行的软件对于提供最快速和最具交互性的 AI 体验同样至关重要。


第一层是 AI 推理库,它充当转换器,用于接收常见的 AI 任务请求,然后将其转换为特定指令以便硬件运行。热门推理库包括 NVIDIA TensorRT、Microsoft 的 DirectML,以及 Brave 和 Leo AI 通过 Ollama 使用的名为 llama.cpp 的推理库。


Llama.cpp 是一个开源软件开发库和框架。CUDA 是 NVIDIA 的软件应用编程接口,可帮助开发者为 GeForce RTX 和 NVIDIA RTX GPU 进行优化,通过 CUDA 可为数百个模型提供 Tensor 核心加速,包括热门的大语言模型(LLM),如 Gemma、Llama 3、Mistral 和 Phi。


除推理库以外,应用通常还使用本地推理服务器来简化集成。推理服务器负责处理下载和配置特定 AI 模型等任务,以便减轻推理库的负担。


Ollama 是一个开放源代码项目,它构建于 llama.cpp 之上,提供对软件开发库功能特性的访问。它支持提供本地 AI 功能的应用生态系统。在整个技术栈中,NVIDIA 致力于优化 Ollama 等工具,以便在 RTX 硬件上提供更快、响应速度更出色的 AI 体验。


Brave Leo AI 等应用可以借助 RTX 驱动的 AI 加速,以增强用户体验。


NVIDIA 对优化的专注涵盖整个技术栈——从硬件到系统软件,再到推理库和工具,以帮助 RTX 上的应用提供更快、响应速度更出色的 AI 体验。


本地与云端对比


Brave 的 Leo AI 可以通过 Ollama 在云端或本地 PC 上运行。


使用本地模型推理具有诸多优势。由于无需向外部服务器发送提示词以进行处理,因此可获得专有且始终可用的体验。例如,Brave 用户可以获得有关财务或医疗问题的帮助,而无需向云端发送任何内容。此外,在本地运行也不需要为无限制的云访问付费。使用 Ollama,用户可以利用比大多数托管服务更广泛的开源模型,后者通常只支持同一 AI 模型的一或两个变体。


用户还可以与专业领域各不相同的模型进行交互,例如双语模型、紧凑型模型、代码生成模型等。


在本地运行 AI 时,RTX 能够提供快速、响应速度较高的体验。使用 Llama 3 8B 模型配合 llama.cpp,用户可体验高达 149 token/s(约等于每秒 110 个单词)的响应速度。将 Brave 与 Leo AI 和 Ollama 搭配使用时,它能更迅速地回复问题、内容摘要等请求。


NVIDIA 内部吞吐量性能测试:在 NVIDIA GeForce RTX GPU 上运行 Llama 3 8B 模型,输入序列长度为 100 个 tokens,输出为 100 个 tokens。


开始使用 Brave 与 Leo AI 和 Ollama


安装 Ollama 非常简单——只需从项目网站下载安装程序,然后在后台运行即可。用户可以通过命令提示符下载并安装一系列受支持的模型,然后从命令行与本地模型进行交互。


有关如何通过 Ollama 添加本地 LLM 支持的简单说明,请参阅该公司博客。配置好 Ollama 之后,Leo AI 将使用本地托管的 LLM 来处理用户请求。用户还可以随时在云端和本地模型之间切换。


Leo AI 在 Ollama 上运行并通过 RTX 加速,使用搭载该助手的 Brave 浏览器可获得更出色的浏览体验。



蛇年将至,NVIDIA 携好运而来!点击下方微博小程序,关注 @NVIDIA英伟达中国 ,转发置顶微博即可参与现金红包抽奖!

评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 203浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 169浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 95浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 726浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 134浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 200浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 154浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 89浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 378浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 751浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 153浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦