梅河口| 株洲县| 上饶县| 崇信| 江门| 东营| 横县| 竹山| 开江| 宽甸| 黔江| 乐山| 肇东| 甘谷| 桃园| 高陵| 黔江| 白云| 沛县| 江津| 同江| 和政| 姜堰| 铅山| 大丰| 云溪| 蒲江| 深州| 吉木萨尔| 长春| 古冶| 乌鲁木齐| 赤城| 深州| 绍兴县| 门源| 江苏| 同安| 科尔沁左翼后旗| 徐州| 宿迁| 大同市| 修水| 惠民| 高雄市| 绥阳| 那坡| 石狮| 安徽| 泸溪| 嘉祥| 光泽| 平远| 宁阳| 白山| 北川| 日喀则| 西峰| 麻阳| 大兴| 连城| 金平| 章丘| 蚌埠| 潮阳| 临海| 龙门| 五河| 根河| 固原| 滦县| 和平| 泌阳| 肇庆| 炎陵| 东海| 都江堰| 玉林| 莘县| 黄陵| 漳平| 金门| 长武| 汶上| 太和| 厦门| 西峰| 马关| 镇远| 藁城| 嵊州| 那曲| 北戴河| 理县| 平潭| 任县| 昔阳| 永清| 大姚| 介休| 洪江| 彰武| 曲水| 天长| 禄劝| 科尔沁右翼中旗| 安新| 泰兴| 雅江| 汨罗| 随州| 杭锦旗| 钓鱼岛| 红安| 昌都| 平和| 新津| 前郭尔罗斯| 崇左| 梓潼| 芜湖县| 梁山| 喀什| 布尔津| 万盛| 南通| 若尔盖| 法库| 潼南| 南漳| 万全| 陈巴尔虎旗| 澄江| 襄樊| 香河| 石城| 宜川| 玉溪| 美姑| 茶陵| 夏河| 南县| 营口| 翁牛特旗| 正安| 潮南| 罗平| 荆门| 江阴| 越西| 平坝| 马关| 丰南| 鹿寨| 弋阳| 鄄城| 湘潭县| 米林| 天山天池| 坊子| 澎湖| 徐闻| 惠来| 新绛| 若尔盖| 桃园| 新野| 图木舒克| 台中市| 扬中| 海盐| 察哈尔右翼前旗| 嘉禾| 东安| 新宁| 和龙| 宁阳| 沂水| 南县| 邯郸| 永福| 乌兰| 华山| 罗山| 柞水| 乐平| 临湘| 大方| 美溪| 黎城| 弋阳| 隆林| 代县| 伊吾| 王益| 平凉| 临高| 正宁| 三亚| 鲁山| 房县| 玉林| 湖北| 吕梁| 彭阳| 成武| 申扎| 庆元| 博鳌| 泸溪| 睢县| 洛浦| 山亭| 武城| 新宾| 察哈尔右翼中旗| 大田| 苗栗| 雷州| 麻栗坡| 莘县| 临泉| 丰都| 泽普| 双牌| 太仓| 望都| 卢龙| 成安| 同江| 英德| 化州| 郧县| 东营| 武定| 浦北| 花莲| 邳州| 武平| 滦县| 嘉定| 博山| 长兴| 碌曲| 乌拉特前旗| 定日| 延寿| 汶川| 纳溪| 蓟县| 五峰| 融安| 铜陵市| 柏乡| 林周| 佛冈| 汉阴| 哈密| 石阡| 肃宁| 社旗| 缙云| 五通桥|

日本八丈岛以东海域发生6.1级地震

2019-09-17 04:18 来源:爱丽婚嫁网

  日本八丈岛以东海域发生6.1级地震

  《中国城市治理蓝皮书(2014-2015)》汇编了2014-2015年度国内权威专家学者关于城市治理的理论前沿观点,杭州国际城市学研究中心承担的国家社会科学基金、国家自然科学基金、中国国际经济交流中心课题及若干省、市政府委托课题的研究成果,杭州城研中心与杭州市统计局联合开展的“城市病”问卷调查报告,以及中国城市治理大事记等内容。王国平指出,对丽水而言,所谓“自转”,是指把九县(市、区)当作一座大城市(大景区)来谋划和建设,加快构筑城乡区域融合发展的多层次、多节点、开放型的网络化格局。

今年中华大学携手企业成立了产学联盟平台—台湾智慧城市研究院,以协助亚洲地区各大城市推动智慧创新,让城乡导入科技服务为目标,搭建产学研智慧服务大数据研究平台,为亚洲地区智慧城市发展注入更多活力。这种竭泽而鱼式的圈地经营给城市的可持续发展带来了一定的负面影响,并可能使城市进一步发展失去动力。

  政府运作的取向。他认为,健康城市是一个非常复杂的概念,必须从系统的角度进行综合考虑。

  (2)纸质信件:浙江杭州余杭塘路2318号杭州师范大学仓前校区,杭州国际城市学研究中心,邮编311121,请注明“钱学森城市学金奖”城市环境问题征集。当前,不应仅单纯注重GDP等量化指标,而要更加注重经济和社会发展并重,维护社会的公平正义是真正走向社会和谐的必然要求。

上饶市四套班子领导,县(市、区)、上饶经开区、三清山风景名胜区、上饶高铁经济试验区、市委部门、市直单位、人民团体、市属企业主要负责人等1500余人在现场或通过视频直播听取了报告。

  在研究方法上,课题组坚持“问题导向、集成导向、角色导向、逻辑导向”,围绕问题体系研究,把复杂的问题划分成简单的问题,以城市管理者为主要服务对象,吃准、吃透并吸收前人研究成果,用最简练的文字对研究成果进行提炼。

  会后,王国平理事长、潘公凯院长分别代表杭州城市学研究会、潘公凯(北京)建筑设计咨询有限公司签署了战略合作协议。通过树立正确的价值观增强文化认同,对城市发展有着重要的引领作用。

  一、概述20世纪80年代中后期以来,经过一系列探索和实践,我国初步形成了具有中国特色的政务公开制度,并在我国民主法制建设、行政体制改革和发展市场经济等方面发挥了积极的作用。

  当一个地区的人口和其他资源的集聚超过一定密度(具体标准各国并不统一),这个地区就成为了城市。了解居民所想、所需,依托组织队伍建设,扶持文艺骨干队伍和志愿者队伍,发挥好蓝翎艺术团、邻里篮球队、景泰蓝工作室等民间艺术组织的力量,大力开展群众文化活动,包括手工制作丝网花、“歌舞非遗和谐邻里”文艺晚会、“颂祖国庆中秋喜迎十八大”中秋活动等。

  根据《城市学研究优秀成果评选奖励办法》,经网上投票、专家评审、专家评审组评审、专家评委会评审、组委会审定,第三届钱学森城市学金奖、西湖城市学金奖征集评选活动各征集平台分别评出金奖作品、金奖提名奖作品。

  希望“两奖”征集评选活动能越办越好,为城市科学发展作出更大的贡献。

  王国平指出,习近平总书记在接受《华尔街日报》采访时指出,“中国梦最根本的是实现中国人民的美好生活”。刘易斯·芒福德曾说:“城市实质上就是人类的化身——城市从无到有,从简单到复杂,从低级到高级的发展历史,反映着人类社会、人类自身的同样发展过程。

  

  日本八丈岛以东海域发生6.1级地震

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

本文作者:程弢 2019-09-17 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
农民对土地的财产权利的实现过程,也就是土地要素逐步市场化的过程,农业转移人口加速市民化的过程,城乡二元结构逐步消除、城乡经济社会融合发展的过程。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
长江仓 罗湖汽车站 天苑花园 寨辛庄村 大江路满江里
夹道灯岗 南五马路 天通西苑南 渣江镇 赤峰道平方