# 竞价系统-天眼查信息

# 概述

目前已对接的内容有企业核查信息(cp_exam_baseinfo)、企业经营异常信息(cp_exam_abnormal)。 每次从天眼查重新调用接口获取信息后,数据都会被存入数据库。

# 刷新方式

  1. 企业登录 企业登录后会通过MQ检查企业核查信息和经营异常,首先在数据库查找,如果未找到或者数据最后修改时间已超过期限 (默认为30天),则会调用天眼查接口重新获取。
  2. 管理端手动刷新 登录管理端,通过“企业管理”-“企业管理”,点击进入企业信息详情,点击右上角的“刷新征信信息” (此方式无视刷新期限,即使数据的最后修改时间是刚刚,都会强制调用天眼查接口获取)

其中,企业核查信息和经营异常的刷新期限都以核查信息的最后更新时间为准。 企业核查信息获取到之后会更新到数据库(不存在则插入)。 而企业经营异常,由于天眼查返回信息没有唯一标志,因此是先删除原有经营异常信息,再执行插入。

# 企业诚信处理

当天眼查获取的基本信息与企业关键信息不符时(法定代表人姓名、地址、营业执照号/统一社会信用代码), 或者天眼查获取的基本信息显示该企业已吊销/注销,则将该企业复核暂停竞价 (bidRight设为6(复核暂停竞价),状态设为9(与工商信息不一致)),并将审核意见记录到注册审批表中。

# 信息解析

由于部分字段的格式或类型与竞价系统的目标类型不一致,因此需要进行解析。

  1. 注册资金
    天眼查返回的资金为文字描述,而竞价系统需要的是数值类型。 经过整理,天眼查返回的金额主要有以下格式:

    • xx万
    • xx万xx(元、美元、英镑、欧元、瑞士法郎、港币、日元、人民币)
    • xx万元人民币
    • xx万人民币元
    • (人民币、香港元)xx万元

    因此可以通过正则表达式提取出数值、数量级、币种, 提取前需要对空格和逗号(有时金额会写成:1,233,233元)字符进行处理。

  2. 所在城市
    由于天眼查信息并不返回企业所在城市信息,因此需要结合省份和地址分析出城市信息。 解析步骤为:

    1. 通过Jcseg分词(配置文件为resources/jcseg.properties,分词字典放在resources/lexicon下) 对企业地址进行分词(只对长度大于1的词语采需要进行进一步分析)
    2. 将上一步得到的词语分别在省、市、区的名称中查找 (省市区的名称记录在resources/下的.json文件中,在启动时载入redis缓存, 也可以在管理端-“系统管理”-“Redis初始化”-tycAreaInfo/天眼查地区信息初始化 点击按钮刷新)
    3. 如果该分词是省份,则记录为省份信息;
    4. 如果该省份为北京、上海、重庆、天津、香港、澳门,则直接返回结果(省市同名)
    5. 如果是城市,则记录省份信息、城市
    6. 如果是区县,则记录城市信息,再根据城市名获取省份名
    7. 部分区县存在重名现象,如北京朝阳区和长春朝阳区,则此时可以结合参考省份区分
    8. 如果没有结合参考省份进行特殊处理,则获取到的是JSON中位置最靠后的同名区县
    9. 最后,如果天眼查提供了省份信息,则与获取到的省份信息进行比对,比对不一致,则抛弃获取到的结果
Last Updated: 3/12/2020, 2:07:22 PM