绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
开源软件平台RAPIDS如何加速数据科学
RAPIDS 2018/12/27 20:00:00
课程讲师
孙鹏 NVIDIA 解决方案架构师

中国科学院大连化学物理研究所物理化学博士。博士期间从事分子反应动力学理论研究,负责组内GPU程序开发,参与国内RAPIDS首批用户测试工作。

孙鹏
NVIDIA 解决方案架构师

中国科学院大连化学物理研究所物理化学博士。博士期间从事分子反应动力学理论研究,负责组内GPU程序开发,参与国内RAPIDS首批用户测试工作。

课程提纲
  • 数据科学面临的挑战
  • 开源软件平台RAPIDS架构解读
  • RAPIDS安装及使用方法
  • XGBoost算法简介
  • RAPIDS应用案例分享
课程简介

大数据分析流程大致分为数据准备、数据合并、数据降维等。在数据准备阶段,数据科学家需要先下载数据,然后还要进行数据抽取、数据转换、数据加载等,而且一般情况下数据包都非常大,所以数据科学家大部分时间是在等待数据准备好,因此有人戏称,数据科学家不是在喝咖啡就是在去喝咖啡的路上。随着数据量越来越大,数据科学家处理数据所需时间也越来越长,导致工作效率非常低。

在今年GTC Europe大会上,NVIDIA发布了一款针对数据科学和机器学习的GPU加速平台RAPIDS,该平台构建于Apache Arrow、PANDAS和SKLEARN等组件之上,通过CUDF数据过滤、CUML机器学习、CUGRAPH数据图像化来加速处理数据,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用CPU提升50倍,大大提高了数据科学家的工作效率。

12月27日晚8点,NVIDIA专场第17讲将开讲,由NVIDIA解决方案架构师孙鹏主讲,主题为《开源软件平台RAPIDS如何加速数据科学》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...