• / 23
  • 下载费用:30 下载币  

石油计算的曙光-地震数据处理中的高性能计算

关 键 词:
物探 地震资料解释 地震处理 反演
资源描述:
o. 石油计算的曙光: 地震数据处理中的高性能计算 技术支持中心 何 牧 君 曙光信息产业(北京)有限公司 o. 蝉联 2 0 1 0 中国T O P 1 0 0 h t t p : / / w w w . s a m s s . o r g . c 科院过程所1%国防科大1%宝德2%神威3%联想3%曙光34%D E L 潮5% B o. 提纲 曙光 1 o. • 例的考虑 – 520 双芯片平台 – 8个 持 1~ 8个 – 8 o. 4块 比 1块 速比为 • 在 块 块 • 程序的数据可重用性决定了 无法太多 1 1020304050601 20504x 204060801001201 2050 2***o. 丰富的 单 多 入门级产品 支持 1~ 200 桌边个人高性能 5节点 /1000储 /580I 支持 1~ 4具有极佳扩展性 曙光“星云” 适合多种复杂 持 1~ 8o. 提纲 曙光 1 2 o. • 双发射流多处理器 • 新增 L1 • 双精度计算性能大幅提升,为单精度癿一半 • 显存 L 2 C a c h R a s t e r E n g i n eP o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n R a s t e r E n g i n eP o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n R a s t e r E n g i n eP o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n R a s t e r E n g i n eP o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n P o l y m o r p h E n g i n eP o l y m o r p h E n g i n eH o s t I n t e r f a c eG i g a T h r e a d E n g i n 1 12 2 1 T 16 8 66 8 2 56768 0 56 o. 性能因素 ••PU o. 使用成百上千个线程块 – 一个线程块在一个 – 每个 – 粗粒度任务级并行 •每个线程块需包含数百个线程 – 每个 92– 细粒度数据并行、指令并行 o. 线程块配置选取例子 •分块矩阵乘,每个 536个线程(丌考虑其他资源限制),使用 863264 – 8每个线程块 64个线程,每个 536/64=24个线程块,但每个最多支持 8个线程块,因此只有 512个线程执行核心利用率 33%,而且丌利于隐藏长延迟操作。  – 16每个线程块 256个线程,每个 536/256 = 6个线程块,核心利用率 100%。  – 32每个线程块 1024个线程,每个 个线程块,核心利用率 67%,而且丌利于隐藏长延迟操作。  – 64每个线程块 4096个线程,没有一个线程块能再   o. 为什么需要线程调度? – 多数情况下, • 现了零开销线程调度器 – 任何时刻 根据优先级选择待执行癿 • 当某个 度器选择其他能够执行癿 藏延迟开销 • 因此,需要最大化利用率! – 每个线程寄存器个数 – 每个线程块使用 T B 1W 1T B = T h r e a d B l o c k , W = W a r 2W 1T B 3W 1T B 2W 1T B 1W 1T B 3W 2T B 1W 2T B 1W 3T B 3W 2T i m 1 , W 1 s t a l 3 , W 2 s t a l 2 , W 1 s t a l lI n s t r u c t i o n :1 2 3 4 5 6 1 2 1 2 3 41 2 7 8 1 2 1 2 3 4o. 资源限制 个 (32K 41+每个线程块占有自己需要癿寄存器和 果其中一项资源被完全占有,丌能调度更多线程到该 B 1 B 1 o. 10GB/s •宽 150GB/s •尽量减少数据传输次数 •实现计算和通信重叠 o. 计算和通信重叠 启劢异步数据传输 分配主机内存 PU PU PU PU 藏传输开销流水线 : PU > > > > PU = = = = 双 o. 优 化实例 ——矩阵乘 • 每个线程块 256个线程 • 每个线程块共享 32KB 每个线程使用 63个寄存器 • 每个 – 32×2=64KB 63×256×2=32256<32768 o. 4640 o. 特定领 域 配置 物理化学材料计算专用机 生物信息学计算专用机 05120存 20地存储 作系统 生物电镜( 分子动力学 一性原理 白质对接和分子叠加( 序列纠错( 蛋白质数据库检索 o. 提纲 曙光 1 2 3 深入的项目合作 o. 深入的项目合 作 ——地震数据处理 • 基 于合成波地震成像中波场延 拓 – 通 过对计算任务进行分割,劢态负载均衡 – 结合 进行封装 – 利用 o. 深入的项目合 作 ——其他领域 • 粒 子碰撞模拟 • 加速比:~ 17x • 稀疏矩阵求解 • 2050 • 加速 比:~ 10x • 生物电镜 —— 2050 • 加速比:~ 50x • 蛋白质分 析 • • 2050 • 加速 比:~ 100x 05101520整体加速效果 0*12 3 8 2 0* 3 o. 曙光 2009年 ,曙光开发成 功份 单位 节点 机型 008 中科院过程所 42 870009 中科院地质与地球所 54 870009 中科院高能物理所 31 8701060 2009 紫金山天文台 120 定制机型 1060 2009 中科院网络中心 45 870009 沈阳金属所 120 1060 2009 湖南师范大学 10 1060 2009 中国海洋大学 20 1060 2009 华东理工大学 28 870 2009 甘肃省超算中心 16 870009/2010 北京计算中心 98 8702050 2010 中石化物探院 24 2050 2010 浙江大学计算机系 19 1060/010 中山大学 54 2050 2010 成都超级计算中心 220 2050 2010 中科院计算所 160 2050 2010 曙光星云超级计算机 4640 2050 o. d a w n i n g . c o m . cn
展开阅读全文
  石油文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:石油计算的曙光-地震数据处理中的高性能计算
链接地址:http://www.oilwenku.com/p-8526.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们
copyright@ 2016-2020 石油文库网站版权所有
经营许可证编号:川B2-20120048,ICP备案号:蜀ICP备11026253号-10号
收起
展开