中国的信用评分生态很有意思。一方面,银行和网贷机构采用传统的信用评分系统来评估借款人的信用、欺诈和其他风险。另一方面,还有一类社会信用评分系统(SCS),包括各类红黑名单及积分体系。许多西方观察家将二者混为一谈:前者是市场导向的传统信用评分,后者是旨在规范和引导公共行为的社会信用评分,尽管两者用到许多共同的数据。
“社会信用”有许多不同的含义,具体含义取决于语境。本文中,我们所指的“社会信用”,既不是H.C.道格拉斯在《社会信用》书中提出的一种政治哲学,也不是已经解散的被称为“Socreds”的加拿大政党,更不是以社交网络帖子来衡量的影响力。本文所说的“社会信用”指的是用来评估可信度和遵守社会规范的程度。这个概念引起了“老大哥在看着你”(Big Brother is watching you!)的联想。然而,令人惊讶的是,社会信用体系得到了中国公众空前的支持。在中国社会中,侵犯知识产权、食品药品制假贩假的事件时有曝光,个人、企业、公务员及党员干部都有可能成为责任人,在中国,似乎任何促进社会道德进步的事情都会受到认同(Creemers 2018)。
社会信用体系的概念在2002年首次被提出,但直到2007年国务院建立“社会信用体系建设部际联席会议”制度后,真正的推进工作才开始。当时,许多权力都下放给了各省市,效果并不理想。因此国务院于2014年再次颁布《社会信用体系建设规划纲要(2014-2020)》,中央重新领导和推进社会信用体系建设工作。其目标包括:1)更好的信用信息共享和发布,包括工商纳税信息、合同履约信息和和产品质量信息;2)合适的系统;3) 建立信用服务市场,政府部门之间打破信息孤岛,整合公民个人数据。
地方试点
虽然重点是信用信息,但地方试点主要聚焦于社会治理。社会信用体系的很多尝试类似交通驾照计分规则,根据失信行为进行扣分;但与一年清零的驾照扣分系统不同的是,失信行为记录年限视行为严重程度不同可达2年至5年,而且还有加分机制。这好似一个棋盘游戏,根据生活中的守信行为和失信行为进行加减分,与游戏不同的是,这些行为发生于现实生活中,并且信用分数会公示。
根据Creemers(2018)的研究,2010年江苏省睢宁县进行了社会信用体系建设试点,每个人均获得1000分的起始信用分数,随后根据失信行为扣分:酒驾(扣50分),违反计划生育(扣35分),贷款逾期(扣30至50分)。信用等级划分为A、B、C、D四级,在一些政策优惠和资格审查过程中会参考这些评级,包括:1)入党政审、入伍政审、公务员录用政审; 2)政府廉租房资格申请、经济适用房申购资格申请,政府采购投标资格申请; 3)经营资质审批,尤其是国家管制行业; 4)政策性扶持、救助项目,包括政策性扶持、补贴类资金申请,政府扶持性低息、贴息贷款申请,和政府资助的劳动职业技能培训申请。睢宁县试点工作以失败而告终,外界评论其尚待改进,且拿抗日战争时期颁发的“良民证”和其作比较。
Mistreanu(2018)报道了最近在山东省荣成市的一个试点:交通罚单(扣5分); 市级荣誉(加30分); 部门级荣誉(加5分); 醉驾(狠狠扣分!)。甚至在人行横道上压线也会被扣分,这纠正了市民的驾驶陋习。社会信用分数会关系到是否能够免押金租用公共自行车,甚至免费骑行1.5小时;享受供暖费折扣;获得更优惠的贷款方案。社会信用分数也适用于企业,基于企业是否按规定缴纳税费或罚款、是否生产销售不合格或不卫生产品(这是中国公众的痛点)来评分。高分者的照片在全社会进行公示。荣成开展的试点工作较为成功,因为它已经被当地人民广为接受,被认为“赏罚分明”。
因此,社会信用评分基于人们是否遵守规则。这些规则不仅仅是信贷方面,还有政治、法律和金融方面,或者其他很多能够应用的领域。在任何领域违约——不仅是违法违规,而是任何违反公德的行为,分数都会受到影响。一些应用旨在增加福祉和便利,例如信用分关系到使用共享单车时是否免押金或收取押金的数量,又例如公开交友网站上会公布用户的信用评分;一些应用旨在限制和惩罚,如信用分被用来限制旅游和获得公共服务。实际上,贷款逾期不仅可能会影响下次贷款,还可能会影响乘坐高铁和入住豪华酒店(最高法院失信被执行人名单包括170,000名严重失信主体)。 Creemers(2018)表示,阿里巴巴的电商平台就禁止了黑名单中的个人购买奢侈品。
社会信用体系建设计划于2020年在全国范围内全面实施。Creemers(2018)认为, 2014年发布的《社会信用体系建设规划纲要》描绘了一幅最具权威的蓝图。其原则是“一处失信,处处受限”——最初重点制裁的是不执行法院判决的行为。 它有个基于黑名单和红名单(记录时间通常为两年)的系统,它没有参考“定量评分”或“关联大数据分析”,而后者恰好是西方信用评分专家的方法(未来可能会在中国实施)。 在一些城市,打电话给失信被执行人时会先听到一段彩铃:“您所拨打的用户已被列入失信黑名单。”被列入多个黑名单的人将被重点监管。另外,信用分的覆盖范围扩大到了政府机关、公务员以及共产党员。
Mistreanu(2018)认为,社会信用体系将不是一个统一的系统。 相反,它将是一个由各级政府运行的体系组合而成的“生态系统”——这些体系由“看不见的信息网络”相互联系,在这个“生态系统”中要通过使用技术来“使现有的政府治理形式扩大化和正规化,使监督管理公民的机制正规化“。各级政府的方案必须经国家发改委的批准。现在即便是像大汛姜家村(荣成市外)一样的村庄也有自己的信用体系建设方案,但它是独立于国家社会信用体系网之外、是以邻里关系为基础的。 Creemers(2018)提到限制乘坐高铁和飞机外出旅游的黑名单,旨在惩罚倒卖票、欺诈性优惠、擅闯驾驶舱以及擅自打开紧急出口等行为。 国家发改委副主任连维良表示,截至2017年初,由于“信用不良”,已有490万黑名单人士被禁止乘坐飞机,165万黑名单人士被限制乘坐高铁(AIPS 2017)。
这些行动可能不仅影响到旅游出行方式,还影响到经济生活和公共服务的诸多方面。社会信用体系建设成果初显,在2017年底,十二个信用“示范城市”受到表彰,它们致力于信用服务基础建设,服务个人和企业。
金融科技的崛起
与建立在信用基础上的美国经济不同,中国的信贷规模在过去的几十年内基本没有增长,直到近年来政府推动市场经济才有所改变。央行征信中心成立于2006年,旨在实现银行间的信息共享,整合法院、政府部门、电信公司和财政部的数据。在当时很多人甚至没有银行账户;截至2015年,中国总人口为13.7亿,央行征信中心的征信数据库覆盖了8亿人,但其中只有3.2亿人拥有信贷记录(Hatton 2015)。
与此同时,许多非银行贷款机构进入了信贷市场,特别是互联网金融机构——其信贷业务迅猛增长。风险不仅与信用有关,还与数据缺失的环境中的欺诈有关——二者之间的区别往往不明确。 每家金融科技公司都在使用自有数据来评估风险,并考虑是否可能与其他持有信用信息的机构一起建立征信机构。2017年,《连线杂志》(Botsman 2017)就报道了阿里巴巴的芝麻信用(可以获取到支付宝的数据)、滴滴出行(乘车)和百度(互联网搜索及其百合网站)之间的合作。
风险评估使用了大量非传统的、富有想象力的的信息; 并且模型本身是个“黑箱”,难以给出恰当的解释。这对于现在涌现各种新数据源、快速变化着的环境,尤其是在使用现代非参数模型和机器学习技术的情况下,司空见惯。尽管现在我们尝试着教育消费者,但其实尚未明确找到个人提高自己分数的方法。至于地址变更、购买尿布、慈善捐赠和用支付宝付款,传闻它们对信用分有影响,但其实这从未被放入模型中(所有这些都会产生影响,但是很小)。支付宝甚至推出了一个玩家可以互猜信用分数的游戏。这便是信用评分世界新生的东方代表。
备注:一般来说,导致消费者信用风险产生的最主要因素是生活事件,如失业、生病以及影响家庭收入的家庭纠纷,然后风险由于过度借贷而被放大。任何具有潜在不稳定性的因素如果能合法地被纳入评估,都可能会影响信用分数。人口统计数据通常包括客户年龄、地址时间、婚姻状况、家庭电话以及总收入。若性别会产生影响,女性通常会获得加分——但通常又被较低的收入抵消了。
即便如此,芝麻信用分还是很受欢迎——在百合网上会公布网站用户的分数。 根据Creemers(2018)的研究,评分维度如下:信用历史占35%; 行为偏好占25%,主要是在线交易数据; 履约能力占20%,即收入或资产;个人信息占15%,主要是可核实和可靠的个人信息;人脉关系占5%,不仅包括好友的信用状况,还包括用户在人际交往中的影响力。 这些听起来合乎常理(除了人脉关系),但问题所在正是细节信息的隐私问题。有新闻报道称,芝麻信用分被用于加快外国大使馆签证签发和开通机场快速安检通道——这引发了人们对黑客入侵和分数操纵所带来的安全威胁的担忧(Ahmed 2017)。
中国互联网金融协会
发展情况并不理想。每家金融科技公司都希望成立自己的征信机构,开发自己的数据库和评分系统,但只服务于自己的业务(从信贷扩展到金融、保险、商业),只关注自己的客户,还要经常担忧数据质量和信息安全性。百行征信有限公司获得了中国首张且目前为止唯一一张个人征信业务牌照。
2016年,中国人民银行推动成立了行业组织——中国互联网金融协会(互金协会)。 随后,互金协会推动建立了中国第一家民营控股的征信机构,它于2018年中进行了征信系统试运行。互金协会拥有百行征信36%的股权,其余由中国人民银行2015年试点的各征信机构持有:芝麻信用(阿里巴巴),腾讯征信(微信),前海征信,鹏元征信,中诚信征信,考拉征信,中智诚征信,华道征信。百行征信并不是接入各机构所有的数据,而是只接入能够标准化的数据——主要包括身份信息、还款记录、欺诈以及相关公开数据。
其目标是降低P2P平台和小额贷款公司的风险(Cheng 2018)。一是通过共享个人和企业的黑名单来打击网络欺诈行为。二是评估信用风险,在此基础上打击寻租者,他们四处搜寻在线优惠券和其他福利,并出售给其他人(欺诈的变种),互联网金融机构常常称之为“羊毛党”。
这些功能不仅可以支撑信贷决策,还有助于商家做出判断——是否可以先发货后收款。对于信贷,替代数据的重要性应该降低——至少对信贷活跃人群(处于增长中)而言——在能获得更多和更好的信用相关行为数据时,人口统计信息的影响力便逐渐减弱。上网时间、玩视频游戏和购买尿布等数据都会影响芝麻信用分(Ahmed 2017),未来这类数据的影响会逐渐减弱。百行征信是否会推出类似FICO分的分数尚未可知,但它提供的数据肯定会主导接入机构所做的信用评估。此外,随着其系统和数据库日趋稳定,各类数据的净效应将变得越来越明显。
即便如此,消费者担心政府可能获得海量数据,以及这些数据的使用可能造成的隐私问题。来自微信(8.5亿人)和芝麻信用(3亿人)的信息将覆盖超过10亿用户。 中国也正在实施《网络安全法》,它比欧盟的《通用数据保护条例》更加繁琐,但它主要针对的是个人和公司,而不是国家机构。今后政府监管是否会参考这些信息? 它将如何被纳入到社会信用体系之中? 有迹象表明政府可以使用这些数据,但究竟如何将其与黑名单联系起来尚未可知。
结论
传统信用评分主要关注贷款偿还,对于熟悉传统信用评分的外国人来说,中国社会信用体系的文献有些令人迷惑。在中国其实有两种不同的评分体系,它们基于来自公共部门和私人部门的大致相同的数据。有人把它们都称为社会信用评分。其实将两者区分为金融信用评分和社会信用评分,或将后者改称为“社会评分”(去掉信用二字),也许会显得更清楚。
西方人可能不赞同社会信用体系。目前,它是一种“粗略的进行社会分类的工具”(Creemers 2018),它公开可见,并被用在了某些不适合的领域。其次,如果贷款违约是由不可避免的生活事件引起的,而与诚信无关,那么不仅会带来出行交通方式(火车/航空旅行)受限的不便利,个人信用分的恢复也将受到影响。但它的某些方面事实上非常适合集体主义社会。当初引入它的动机就是解决中国向市场经济转轨过程中产生的极端的违法问题(想想美国1890年代的强盗男爵),所以如果社会更加诚信,发展就会变得更加顺利!
至于目前采用的个人评分方案......最重要的是评分系统对其影响的人的最终效果如何。 最终,如果人们更好地遵守了社会规范,社会也取得了进步,评分系统就很难被批评。尽管看起来起初的系统非常复杂,很多不同的机构开发了不同的评分系统,但最终目标应该是在预测模型中更有效地使用数据。
至于金融信用评分,“玫瑰不管叫什么名字仍然是玫瑰”,这句格言仍然适用。如果目的是更合理地评估信用风险,那么不管数据来自何方,也不管它是否用于其他无关的目的——它仍然是金融信用分。也许西方国家应该效仿中国的做法,考虑将信用评分用于其他领域的个人激励或惩戒。