## 启信宝数据
### 数据维度
* 启信宝有哪些数据维度,数据来源是什么?
为了确保数据的质量,我们的数据来源有很多种:
* 购买的
* 合作的数据,对公开的数据进行交换
* 舆情:网络爬虫。
* 政府直接对接
进行交叉验证。具体而言
* 工商信息来源企业信用信息公示系统,和工商内部数据,内部数据更新延迟较高,启信宝进行多方验证。
* 司法信息来源全国四级区县、市级、省级、最高院5000多家,数据的全面性
* 知识产权等信息也来自各政府权威官网(国家知识产权网)
### 更新周期
* 数据更新周期?数据更新机制?数据是实时的吗?
——对外——
在如此庞大的数据量基础上,数据的更新机制分为周期更新和触发式更新:
* 周期更新:对在库的全量企业信息,根据企业所在地区的经济发展情况、企业的热度等分为不同梯队: 江浙沪、北京、广东等经济发达地区区域2-3天更新,中部地区一周左右,偏远地区两周以内,个体户1个月左右;
* 触发式更新:对我们企业版、API等付费客户,所查询的企业都自动触发更新;
* 企业版监控和API监控范围内企业每天更新。
——对内——
首先说明数据量大。
启信宝的数据以企业为主体,收录了全国范围内(包括香港))1.8亿企业,其中有企业7千万(异常状态2千万),个体1.1亿,社会组织和律所140w,要实现T+1的更新不太现实。
所以我们采取了。
- 周期性更新:
- 江浙:优先更新,2~3天
- 中间:1~2周
- 偏远:2周
- 个体:1个月
热门T+1,2,全量5~10个工作日
- 触发更新:
- 企业版触发所有维度的更新,但是返回的有些数据更新时间会长一点,
- 接口:触发工商更新
- 我们会选用相对合理的更新机制
- 对于实时接口
- 查本地库,如果是今天的数据,就不会更新
- 如果不是今天的数据,将会更新
- 等待时间会长(商谈每周更新是否合适)
### 数据准确性
全国各地的工商网站,相对于全国工商网站更新频率会更快,因为地方是要更新到工商网站上的。
启信宝的数据来源于政府的官网网站(企业信用信息公示网、裁判文书网、各级法院官网、国家版权局等)
在保证数据更新周期的情况下,与官网信息保持一致。并且在有启信宝通过多方数据源对企业数据进行校验,保证数据的准确性。
## 启信宝产品
### 优势
* 数据源:数据质量更高,主要为泛金融客户提供服务,很多企业客户验证过了。
* 更全:全量的数据多方验证果
* 保存了历史数据