主题 : 英伟达 Jarvis 1.0 工具详解:开发速度提升 10 倍,延时不到 300 毫秒
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605049
威望: 529657 点
无痕币: 47 WHB
贡献值: 0 点
在线时间: 62583(时)
注册时间: 2008-12-25
最后登录: 2024-05-18

0 英伟达 Jarvis 1.0 工具详解:开发速度提升 10 倍,延时不到 300 毫秒

管理提醒: 本帖被 hexj9 从 『Windows 10 专区』 移动到本区(2021-03-01)
2 月 27 日报道,凭借听、读、译三大功能,对话式人工智能(AI)正逐渐深入人们的生活,成为解放双手和提高生产力的关键工具。
当你说话时,对话式 AI 能实时将你说的话记录成文字,甚至可以实时翻译成其他语言。
当你听不懂、记不住医生叮嘱的药物或治疗方案时,接受过海量医学文本训练的对话式 AI,能帮你准确地记下全部医嘱。
当你因为开车等原因不方便看手机时,对话式 AI 能将屏幕上的文字读给你听。
它既能做稳定的速记员,也能胜任专业的翻译官,越来越多企业采用对话式 AI 来改善工作效率与优化客户支持。
不过,要开发出一款优质的对话式 AI,并不是一件容易的事。如果只追求最快的响应速度,难免牺牲语音识别、语言理解、语音生成的质量,而如果过于重视质量,可能会响应的不够及时。
怎样能快速开发出高质量的对话式 AI,满足专业的转录和编译需求?知名硅谷芯片巨头 NVIDIA 刚刚推出了一个相当有用的工具。

一、降低实时对话式 AI 开发门槛的神器
2020 年初突然爆发的新冠肺炎疫情正刺激企业 AI 的应用,从远程教育、远程办公、客户服务到医疗健康,众多行业加速出现对 AI 的需求。
知名市场调研机构 IDC 的数据显示,2019 年全球对话式 AI 的支出约为 58 亿美元,这一数字有望到 2023 年攀升至 138 亿美元。其中,中国对话式 AI 市场规模有望从 2019 年的 5.761 亿美元增至 2023 年的 18.593 亿美元,年均复合增长率(CAGR)为 34.0%。

▲2019-2023 年中国对话式 AI 市场预测(来源:IDC)
什么是对话式 AI?简单理解,就是一种能自动理解人类语言的系统,使得人与机器的交流像人与人之间的交流那样轻松、自然而高效。
想想我们的日常沟通过程,我们不会向对方发出固定的指令,而是用自然的语言进行交流。
而要让机器更加自然、拟人化的与人类互动,需要先让机器理解你所说的话,即时了解上下文和语言,判断话的意图和隐藏含义,并以最自然的对话方式做出回应。

▲基于 NVIDIA Jarvis 实现的语音助手示例
在疫情刺激下,英国高性能语音识别服务供应商 Intelligent Voice 发展势头相当迅猛,几个月内即推出了新产品 Myna,能连接到虚拟会议工具,自动记录、将录音转换成文本并发送文本记录。
Myna 得以快速实现的秘密武器,即是 NVIDIA 去年 5 月首次公布的实时对话式 AI 模型工具 Jarvis。
Jarvis 是一个基于 NVIDIA GPU 提供实时性能的灵活、多模态对话式 AI 服务应用框架。
“Jarvis 采用多模态的方法,将自动语音识别的关键元素与实体和意图匹配相融合,满足需要高吞吐量和低延迟的新用例的需求。Jarvis API 不但易于使用,还能整合和自定义客户的工作流程,实现性能优化。”Intelligent Voice 首席技术官 Nigel Cannings 说。
另一家创建阿拉伯语虚拟助手的公司 InstaDeep 同样是 Jarvis 的早期采用者。通过 Jarvis 中的 NeMo 工具包,这家公司对阿拉伯语语音–文本模型进行微调,将单词错误率降低至 7.84%。
通过早期采用者的反馈与优化,Jarvis 逐渐实现了更高的吞吐量和更低的延迟。在打磨成熟后,NVIDIA 于昨日正式推出 GPU 加速的 Jarvis 1. 0 公测版。
级别: 六行秋雁

UID: 82452
精华: 0
发帖: 8382
威望: 19137 点
无痕币: 640 WHB
贡献值: 3 点
在线时间: 2049(时)
注册时间: 2009-04-27
最后登录: 2024-04-07

机上数据库,是不是可以无缝对接呢
Total 0.061202(s) query 5, Time now is:05-18 10:33, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛