欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
南大周志华团队开源新深度森林软件包
2021-02-01
机器之心
20
机器之心消息,经过 LAMDA 徐轶轩等人的不懈努力,新的深度森林软件包 DF21 在 GitHub 与开源中国同时开源了。针对这一开源项目,深度森林参与者之一(现任创新工场南京 AI 研究院执行院长,倍漾资本创始人)冯霁博士表示,深度森林在表格数据建模上,相对传统算法效果显著,但是之前开源的代码主要用于算法验证,以及辅助其他科研工作者进行深度森林算法相关的研究,代码本身对内存和服务器性能要求较高。
针对深度森林固有的内存消耗、只能用 CPU 训练等问题,徐轶轩表示,此次发布的这个模型主要解决的问题就是内存消耗,此前的 gcForest 在处理百万级别的表格型数据集上,占用的内存可能会达到上百 GB。但在新版本中,在千万级别的表格型数据集上进行训练,占用的内存约为原来的十分之一左右。
据介绍,该项目目前主要由南大徐轶轩进行开发和维护,在正式发布之前它已经在 LAMDA 内部经过测试和使用。
项目地址:http://www.lamda.nju.edu.cn/deep-forest/Gitee 地址:https://gitee.com/lamda-nju/deep-forestGithub 地址:https://github.com/LAMDA-NJU/Deep-Forest