数据挖掘

为机器学习和深度学习提供从数据处理、模型训练、服务部署到预测的一站式服务。

    产品信息

    数据分析挖掘简介

    数据挖掘产品是一个通用的数据分析挖掘平台,支持主流的机器学习算法,提供单机与集群的机器学习框架支持。结合容器提供的开箱即用、Spark集群提供的强大性能等特性,为用户提供模型开发、模型训练、模型部署等一站式数据挖掘服务。

    产品特性

    丰富算法框架支持

    支持主流数据挖掘算法,涵盖分类、聚类、回归等;支持多种数据挖掘框架,如sklearn、lightGBM、XGBoost、SparkMLlib等。

    多种交互方式

    提供可视化拖拽的方式构建模型训练工作流及基于notebook编码的方式构建模型;提供了网格搜索(grid-search)和交叉验证(cross-validation)等超参优化策略进行参数调优

    一站式数据挖掘平台

    覆盖数据挖掘全流程,包含数据读取、特征工程、超参数调优、模型训练、模型部署以及模型重训练等数据挖掘全生命周期。

    多种推理方式支持

    提供了模型封装功能,满足平台标准的模型可以一键发布为支持高吞吐、低延时的实时在线推理服务(基于微服务架构),也可以发布为支持TB级别数据的离线推理服务。

    应用场景

    金融风控

    业务类型

    金融风控

    应用场景

    金融领域中需要使用各种数据挖掘技术和手段对金融事件(信用卡消费行为或贷款申请)或金融主体(个体或企业机构)出现违约的风险进行预测,在金融行业有广泛的应用。

    营销响应建模

    业务类型

    营销响应建模

    应用场景

    响应建模通过定位那些更可能对特定优惠、营销活动、广告、媒体或优惠有所反应的消费者来改善消费者响应率。这意味着需要通过数据挖掘的手段和技术对每个客户的潜在响应概率进行估算。营销人员将营销预算集中于那些可能响应的受众,而不是全部受众。响应建模是营销人员用较少预算获得更好营销效果的致胜法宝。

    推荐引擎

    业务类型

    推荐引擎

    应用场景

    推荐引擎是主动发现用户当前或潜在需求,并主动推送信息给用户的信息网络。

    推荐引擎不是被动查找,而是主动推送;不是独立媒体,而是媒体网络;不是检索机制,而是主动学习。推荐引擎利用基于内容、基于用户行为、基于社交关系网络等多种方法,为用户推荐其喜欢的商品或内容。

    推荐引擎已经成为电商、社交媒体、内容媒体提高用户体验和用户粘性的重要工具。数据挖掘组件内置了多种推荐算法,可以帮助客户搭建自有推荐引擎。

    流失预警

    业务类型

    流失预警

    应用场景

    流失预警是CRM(客户关系管理)中主要技术之一,现代CRM理论会将客户与品牌的关系处在一个生命周期中,不同的生命周期阶段需要采取不同的手段来强化客户与品牌的关系。老客户与品牌的联系变弱的末期通常需要一些挽回手段来对老客户进行挽留和激活。这时候就需要流失预警技术来预测哪些老客户处在流失边缘,以便品牌对这部分客户进行挽留和激活。

    产品功能

    数据集管理

    模型开发

    模型管理

    • 将外部数据源作为抽象数据集导入数据挖掘用于模型训练和预测。

      支持将异构数据源添加为抽象的数据集,并且提供统一的程序接口SDK对异构数据进行读写,用于数据挖掘任务和离线推理任务等,支持用户,项目,公开等多维度的权限控制。

    推理服务