Dynamic Page Retirement(动态内存退休/退出)

AI 

GPU开启ECC,可以检测到2种内存错误:single Double Bit ECC Error (DBE) 或 2 Single Bit ECC Errors (SBE),其中DBE事件会通知程序优雅关闭,SBE事件程序不会影响,可以正常运行。当发生DBE或SBE时,会将该地址加入 Page Bl

58同城 X 天津大学:AI集群资源调度和应用混部

AI 

近年来,人工智能技术的快速发展对高效率智能计算系统的需求越来越大。在58同城平台内部,越来越多的服务使用深度学习模型和技术来驱动,这些工作负载具有一些典型的特性,例如:在线推理服务请求的“高峰低谷”现象,导致部分时段系统资源利用率偏低;离线训练集群则存在部门之间资源争抢、分配不公等问题,导致GPU集

TensorFlow初印象


1. TensorFlow产生的历史必然性2. TensorFlow与Jeff Dean的那些事3. TensorFlow的应用场景4. TensorFlow的落地应用5. TensorFlow的发展现状

程序员们,AI来了,机会来了,危机也来了

AI 

程序员们,AI来了,机会来了,危机也来了转载自 麦好1. 人工智能真的来了​ 纵观古今,很少有计算机技术能有较长的发展寿命,大部分昙花一现,比如:昔日的DOS、windows3.2、foxpro、delphi、80x86汇编,还有很多技术也在艰难地挣扎,比 如:VB、PB、Sqlser