post top image

比特大陆全球首发SOPHON张量处理器-解决方案

2017年11月8日,主题为“AI新万象,中国智能+”的AI WORLD 2017世界人工智能大会在北京召开。比特大陆(以下简称BITMAIN)受邀参会,比特大陆(BITMAIN)联合创始人、CEO詹克团先生以“AI驱动的又一个星球级计算”为主题发表演讲,全面介绍了AI在未来的星球级计算中的宏大数据和应用,并正式发布了BITMAIN旗下AI品牌SOPHON(算丰),以及全球首款张量加速计算芯片——BM1680。此外,板卡SC1/SC1+、智能视频分析服务器SS1等重量级产品也都开始量产出货。

詹克团在大会现场公布了BITMAIN自研的芯片、板卡、服务器等产品,并基于这些产品展示了视频图像分析、人脸人体检测等技术。之后,这些产品将在官网SOPHON.AI中面向全球发售。

人工智能计算架构的未来

近年来,伴随着数据需求的急剧膨胀,深度学习算法和计算技术的亟需突破,人工智能在全球范围内掀起了一股新的浪潮。人工智能为社会带来了重大变革,但同时也为IT产业带来了巨大的挑战,随着人工智能计算的需求剧增,现有计算架构遭遇功耗墙、性能墙、内存墙、摩尔定律趋缓等挑战,迫切需要计算架构的创新。

人工智能驱动了又一个星球级的计算体量,也驱动新的计算架构创新。在感知智能方面如图像、视频、语音、自然语言的识别和理解方面,人工智能应用越来越深入,并不断推动着行业的智能化变革。

BITMAIN CEO詹克团表示。

作为一家出身于数字货币芯片和设备的公司,同时也是世界上最大的比特币矿机芯片公司,BITMAIN坚定的看好AI在各行业应用场景落地,驱动行业智能化。

入场人工智能领域,是BITMAIN的重要一步。从研发数字货币芯片、矿机到设立矿池,比特大陆自主研发,自主布局完善产业链。而现在,是BITMAIN进军人工智能行业的最佳时机。BITMAIN致力于通过强大的芯片工程、快速迭代和系统设计制造能力,提供最具性价比、最具性能功耗比的AI计算力,同时致力于为行业定制、优化全栈的硬件和系统方案,从而极大降低行业+AI的难度,促进AI普及。

比如我们今天发布的完整的服务器产品SS1,基于自主研发的芯片和板卡,集成了视频智能分析算法,用户可以开箱即用的方式实现人脸人体检测、视频智能分析功能,通过调用算法API的方式,快速的实现系统集成到视频大系统。同时SC1板卡等产品也对外发售,客户可根据官方API进行二次开发。

5b3498fd00dc0.jpg

5b34991761238.jpg

全球首发SOPHON TPU芯片BM1680SOPHON SC1/SC1+板卡

SOPHON TPU芯片BM1680,面向深度学习应用的张量计算加速处理的专用定制芯片,适用于CNN、RNN、DNN等深度神经网络的推理预测(Inference)和训练(Training)。

BM1680单芯片能够提供2TFlops单精度加速计算能力,芯片由64 NPU构成,特殊设计的NPU调度引擎(Scheduling Engine)可以提供强大的数据吞吐能力,将数据输入到神经元核心(Neuron Processor Cores)。BM1680采用改进型脉动阵列结构。片上32MB SRAM拥有高带宽,在片外有DDR4内存接口,单芯片可支持高达16GB DDR内存。

通过高度定制的BMDNN Chiplink芯片链路技术,在高速SerDes上提供稳定、灵活、低延迟的链路,可以使多个BM1680芯片一起工作,作为一个统一的系统,可以提供更高的处理能力。

5b349930cdb08.jpg

BM1680芯片架构图(摘自BM1680 DATASHEET文档)

基于BM1680芯片,BITMAIN提供SOPHON SC1和SC1+的板卡产品。其中SC1 拥有一颗高性能的BM1680芯片,而SC1+ 则是双BM1680级联架构,芯片之间通过高速SerDes Chiplink互联,为深度学习计算带来全新的加速体验。

5b34997b003f7.jpg

SC1和SC1+的架构类似,都通过PCIE的总线连入系统。具备高达2TFlops / 4TFlops的单卡计算能力(单精度),单芯片On Chip SRAM高达32MB,较大的SRAM适合装载整个神经网络模型。同时在板卡上搭载16GB 或32GB DDR4内存,大容量存储适合存储较大的神经网络模型。

5b3499990c966.jpg

SC1 / SC1+ 板卡实物图

5b3499b6df146.jpg

板卡实物图

L1pcxVoGiTCALX82AACfcfj5OaA467.jpg

SC1/SC1+规格参数一览


SOPHON芯片和板卡的软件接口和全栈软件支持

5b3499e5b628d.jpg

SOPHON拥有软硬件全栈开发的能力,和各个层次的工具链能力,从硬件、驱动、指令集、线性代数加速核心数学库,RUNTIME库,BM Deploy的Inference部署工具,FFT加速库,深度学习框架(Caffe,Darknet,Tensorflow,MXNet等)。真正实现了软件、硬件的协同设计和一体化的优化,实现深度学习应用在硬件上的最佳优化性能。


SOPHON SS1智能视频分析服务器

智能视频分析服务器SOPHON SS1,是一款新的深度学习服务器。基于BITMAIN最新研发的SOPHON SC1/SC1+深度学习加速卡和对于图像识别算法的深度理解而打造的深度学习服务器,专门为视频监控、互联网图像等多种应用场景提供强大的深度学习加速能力。

SOPHON SS1提供了一整套针对视频和图像识别技术的深度学习解决方案。系统核心组件是两张SOPHON SC1(或SC1+)深度学习加速卡,通过PCIE接口实现与应用系统的连接。SS1的应用系统基于X86 CPU打造,以供启动、存储管理及深度学习SDK协调之用。SS1的整个系统被浓缩进一个4机架单位(4U)机箱中,集电源、冷却、网络、多系统互联及文件系统于一体,客户可以在此基础上实现快速的二次开发或系统集成,最大程度上方便了用户对深度学习系统的利用。

L1pcxVoGjMKAOtHFAAO8dvQmBr8173.jpg

SOPHON SS1实物图


SS1具备的几大特点:

  • 为应用场景而定制的Turn Key开箱即用的方案
  • 高性能的异构计算优化,异构协同
  • 首个为深度学习预测/推理而优化的软硬件CoDesign方案
  • 强大的工程和研发团队支持
  • 数据中心级别的硬件品质
  • 向用户开放全部的软件源代码

L1pcxVoGidKAZ7RIAADSVrHR9GI035.png


SS1规格参数


SOPHON 视频分析AI应用展示

SOPHON SS1服务器集成的人脸/人体检测、机非人视频结构化分析等等DEMO,展示行业应用方案能力场景,落地视频分析安防行业方案。展示人检测,车检测等等。BITMAIN也将快速快速迭代的视频结构化API。

L1pcxVoGie6AU4BHAADW9AxZ0Qs888.jpg


5b349a2c923e7.jpg

SOPHON板卡和服务器,将在官网SOPHON.AI面向全球发售

全球官网SOPHON.AI已经全面发布,客户可以了解最新的产品、方案信息。

板卡产品SC1/SC1+规格和发售价:

SC1

SC1+

搭载芯片

1颗BM1680

2颗BM1680

计算力

2TFlops FP32

4TFlops FP32

板卡接口

PCIE X8

PCIE X8

功耗

85W

150W

官网发售价

¥4620 / $589

暂未单独发售

服务器SS1规格和发售价:

主处理器

Intel E3 1275V6, 4 Cores, 3.8GHz (Max Turbo 4.2GHz)

深度学习加速卡

2块SC1+

官网发售价

¥30400 / $3869


比特大陆(BITMAIN)成立于2013年,在超高性能计算领域有强大的研发能力,成功开发并量产了多款ASIC定制芯片和整机系统,拥有先进工艺28nm、16nm、12nm的集成电路全定制设计的量产经验。其中最具代表性的是其运用在加密数字货币矿机中的BM芯片系列。据官方资料显示,比特大陆自主研发的第五代芯片BM1387是全球功耗最低、性能最高的运算加速芯片,单片每秒可完成800亿次的算法计算,量产规模达数十亿颗。

正是在加密数字芯片中的超高造诣,BITMAIN早已布局逐渐火热的人工智能领域。随着人工智能算法和应用技术的日益发展,以及专用芯片ASIC产业环境的逐渐成熟,人工智能ASIC芯片在计算领域的重要性将越发凸显。未来,BITMAIN将持续发力人工智能领域,加大AI团队的资金和人才投入,加速人工智能的发展。

在此次发布的第一代人工智能产品BM1680芯片,以及板卡、服务器等的基础上,面向未来,BITMAIN将保持创新和快速迭代,将于2018年推出基于12nm FinFET制程的性能功耗比更高的第三代产品,并预计在2019年推出第四代SOPHON BM系列产品,加速人工智能时代的进程。

比特大陆(BITMAIN)的人工智能(AI)品牌名SOPHON,来源于著名科幻小说《三体》的智子。中文品牌名算丰,取“算天地玄空,丰认知智能”之意。

公司电话:+86-10-5327-3900

公司传真:+86-10-5327 3999