Generic placeholder image

征信数据

8个信息模块 84张信息表 353个信息节点

查看详情 »

Generic placeholder image

银联数据

10个信息模块 68张信息表 2984个信息节点

查看详情 »

Generic placeholder image

通信数据

14个信息模块 72张信息表 3139个信息节点

查看详情 »


特征变量库

完整性:设计提供数万条特征变量,可提炼5%左右有效变量,实验室正在开发数十万变量,并持续更新,为各种模型开发提供更加高效、清晰以及灵活的特征变量。
维度全:维度涵盖业务种类、机构类型、账户状态、时间范围等等,同时利用维度间的交叉生成更多的二阶三阶变量。
无歧义:标准化的特征变量命名、接口及代码可以实现便于管理和交接,用SQL清晰地描述特征变量的加工步骤,做到前后台人员易于理解、无歧义。
易管理:特征变量的加工逻辑代码进行系统化的管理,做到各个版本的加工逻辑代码可回溯,并且能够快速灵活查询到想要的特征变量。

Generic placeholder image

仿真数据库

完整性:仿真数据库的构建是完整的遵循数据源的内容、组成结构、数据组织形式,结构和数据源严格一致。
扩展性:在遵循完整性的前提到,对报告各信息节点单节点分布、信息节点间关系、信息模块间关系,按行业经验的人群分布,对数据源进行仿真;可以通过调整报告数量、调节各节点分布比例及增加更完备的关系,对数据进行灵活的扩展。
高效性:仿真数据库中所有数据是批量自动生成,整个生成过程是一次自动完成的,无需要人工干预,可达分钟级生成上百万征信报告。
便捷性:仿真数据库存储结构,完全按数据源标准信息组织结构进行存储,支持关系型数据存储、文件方式存储(如:XML、HTML、PDF)、SAS数据集等等形式存储,可与客户数据进行无缝对接。

Generic placeholder image

库内建模

自主性强:建模所用特征变量、及目标变量,统一来自特征变量库,无需与其它数据源对接也可实现库内建模
适用面广:可在库内根据不同维度灵活定义目标变量,构建不同模型; 应用:风险、营销等等; 业务:信用卡、贷款等等; 表现期:1个月、3个月、6个月、12个月等等;
自动建模:建模过程自动处理 1、根据目标变量定义,自动生成样本; 2、自动进行变量同质处理; 3、变量筛选自动化; 4、模型变量筛选自动化; 5、评分卡自动生成; 6、模型评价报告自动生成
一键部署:部署方便,模型可以根据生产环境需要一键生成模型变量代码、评分卡打分代码,无缝部署,无需增加客户IT部门的开发工作

Generic placeholder image