今天,人工智能计算公司「英伟达」发布了最新的GPU产品——TeslaT4(T代表Nvidia的新图灵架构)。
「英伟达」TeslaT4
这次推出的新产品主要用于机器学习和数据推理,对现在广泛使用的P4图形处理器有很大的革新。当前,几乎所有的大型云计算供应商都能够提供P4GPU,而「英伟达」想要将技术推到更新的一代。TeslaT4的配置,总共有320个图灵张量内核和2560个CUDA核心。
「英伟达」表示,谷歌将是首批运用T4GPU的公司,该技术将推向谷歌的云平台。「英伟达」TeslaT4的速度明显快于P4。例如,对于语言推理能力来说,T4比使用CPU要快34倍,比使用P4快3.5倍。
最重要的是,TeslaT4是「英伟达」专门为人工智能推理设计的。公司副总裁、数据中心业务的副总裁IanBuck表示,TeslaT4之所以能如此高效地进行人工智能推理,是因为它的新图灵张量核心。「英伟达」CEO黄仁勋谈及张量核心,说它不仅能服务于游戏、渲染,还可以用来做计算机推理。
除了这个新的芯片,「英伟达」还推出了一款用于优化深度学习模式的TensorRT软件。TensorRT推理服务器,这是一种完全集成化的数据推理服务,无缝地插入到现有的Kubernetes设施中。
TeslaT4的运算能力
「英伟达」正在与微软进行合作,后者使用的是「英伟达」的芯片开发AI功能,如微软小娜(Cortana)和必应(Bing)中的语音和脸部识别。而据外媒报道,华为可能与英伟达展开了竞争。微软正与华为讨论合作事宜,考虑在微软中国数据中心使用华为新开发的人工智能芯片。
D²NN设备识别文本