GPU 是黄氏定律的基础今年 5 月,英伟达发布了面积高达 826 平方毫米,集成了 540 亿个晶体管的 7nm 全新安培(Ampere)架构 GPU A100。相比 Volta 架构的 GPU 能够实现 20 倍的性能提升,并可以同时满足 AI 训练和推理的需求。
凭借更高精度的第三代 Tensor Core 核心,A100 GPU AI 性能相比上一代有明显提升,我们此前报道,在 7 月的第三个版本 MLPerf Training v0.7 基准测试(Benchmark)结果中,英伟达的 DGX SuperPOD 系统在性能上开创了八个全新里程碑,共打破 16 项纪录。
另外,在 10 月出炉的 MLPerf Inference v0.7 结果中,A100 Tensor Core GPU 在云端推理的基准测试性能是最先进英特尔 CPU 的 237 倍。
更强大的 A100 GPU 迅速被多个大客户采用,迄今为止,阿里云、百度智能云、滴滴云、腾讯云等众多中国云服务提供商推出搭载了英伟达 A100 的多款云服务及 GPU 实例,包括图像识别、语音识别,以及计算流体动力学、计算金融学、分子动力学等快速增长的高性能计算场景。
另外,新华三、浪潮、联想、宁畅等系统制造商等也选择了最新发布的 A100 PCIe 版本以及英伟达 A100 80GB GPU,为超大数据中心提供兼具超强性能与灵活的 AI 加速系统。
Dally 在演讲中提到:“经过几代人的努力,NVIDIA 的产品将通过基于物理渲染的路径追踪技术,实时生成令人惊艳的图像,并能够借助 AI 构建整个场景。”
与光链路取代现有系统内的电气链路需要软硬件的匹配一样,英伟达 GPU 软硬件的结合才能应对更多 AI 应用场景苛刻的挑战。
Dally 在此次的 GTC China 上首次公开展示了英伟达对话式 AI 框架 Jarvis 与 GauGAN 的组合。GauGAN 利用生成式对抗网络,只需简略构图,就能创建美丽的风景图。演示中,用户可通过语音指令,即时生成像照片一样栩栩如生的画作。
GPU 是黄氏定律的基础,而能否实现并延续黄氏定律,仅靠少数的大公司显然不够,还需要众多的合作伙伴激发对 AI 算力的需求和更多创新。
黄氏定律能带来什么?英伟达已经在构建 AI 生态,并在 GTC China 上展示了英伟达初创加速计划从 100 多家 AI 初创公司中脱颖而出的 12 家公司,这些公司涵盖会话人工智能、智慧医疗 / 零售、消费者互联网 / 行业应用、深度学习应用 / 加速数据科学、自主机器 / IOT / 工业制造、自动驾驶汽车。
智能语音正在改变我们的生活。会话人工智能的深思维提供的是离线智能语音解决方案,在占有很少空间的前提下实现智能交互,语音合成和语音识别保证毫秒级响应。深声科技基于英伟达的产品研发高质量中英文语音合成、声音定制、声音克隆等语音 AI 技术。
对于行业应用而言,星云 Clustar 利用英伟达 GPU 和 DGX 工作站,能够大幅提升模型预测精确度以及解决方案处理性能,让传统行业的 AI 升级成本更低、效率更高。
摩尔定律的成功带来了新的时代,黄氏定律能否成功仍需时间给我们答案。但这一定律的提出对 AI 性能的提升给出了明确的预测,并且英伟达正在通过硬件、软件的提升和创新,努力实现黄氏定律,同时借生态的打造想要更深远的影响 AI 发展。
黄氏定律值得我们期待。