1. 梦飞科技 > 中国IDC > 大数据 > 大数据资讯 >
  2. 当金融遇到大数据 会擦出什么样的火花?(2)

当金融遇到大数据 会擦出什么样的火花?(2)

随着海量数据存储和处理技术的发展,数据的价值将进一步凸显,银行自身要用好数据,基于客户账户数据进行客户画像,预测客户潜在需求,推出有竞争力的产品,根据客户消费数据,结合场景进行智能推荐,并进行风险预测和干预,提升盈利水平,作为金融数据服务提供方,要能在合规的前提下提供高质量的数据服务,打造场景化的金融生态体系。

1

云时代背景下,大数据(Big Data)吸引了越来越多的关注,数据中蕴藏着丰富的价值,通过提升数据管理和处理能力,应对数据急速增长的挑战,更多、更好地挖掘数据的内在关系并加以应用,成了金融业发展共同的目标。

随着业务发展和公司治理要求的不断提高,各类应用系统产生的数据量急速增加。据初步统计,目前行内各应用系统每年产生的非结构化数据已经超过1PB,结构化数据也以百TB计,加之已归档的历史数据,总数据量已经需要以PB为单位计算。

数据的特点可归纳为“4V”。数据体量大,数据类型繁多,价值密度低,云主机租用,处理速度快。当前的软硬件环境,在爆炸式增长的业务和管理数据面前,凸显出了若干问题,包括数据存储成本高、横向扩展能力欠缺、大规模数据分析性能较差、历史数据难以有效利用等。数据的急剧增长和类型复杂迫切需要快速且有效的处理技术,而以Spark、HBase、Kafka等为代表的Hadoop生态系统则是大数据处理领域的利器。

金融业遇到大数据技术,能带来什么点石成金的效果,可从几个典型的应用场景中见到。

一是海量金融数据的存储与管理,交易渠道的多样化带来明细类结构化数据的快速增长,“双录”等监管类要求使影像、图片、电子凭证等非结构化数据也呈井喷之势,传统的数据库、内容库等技术因扩展性不高而应对乏力。Hadoop的分布式架构特点为应用提供海量数据管理方面的核心能力,包括结构化数据或半结构化数据的存储、查询等,在一定程度上替代传统关系型数据库的功能;非结构化数据的存储和管理,在一定程度上替代传统文件系统的功能;结构化数据、半结构化数据或非结构化数据的统计、分析、挖掘能力,可基于此构建数据仓库或数据集市,形成互联网银行业务拓展的数据支撑,完成多格式文件随机存取管理、海量数据统计、分析等多种场景的应用实践。

二是客户画像与精准营销。金融业面对的客户群体数量众多,需要快速识别目标客户,推出有竞争力的金融产品并进行精准化营销,依托大数据技术的客户画像正是实现该目标的利器,其核心是对客户属性的标签化。

三是交易监控与实时风险识别。金融业竞争中,保证实时性也就保证了竞争的优势地位,要做到交易快速响应,在用户无感知的情况下,完成风险识别等操作,既确保交易的安全性,又不影响客户体验。

四是多维分析与商业智能。

五是基于内容的业务知识智能检索。通过对于用户输入的关键字等内容与海量检索对象进行相似度匹配,并依据相关性高低进行排序,返回用户最可能需要的内容,并基于用户反馈及时调整检索结果,保证检索的有效性。

六是历史交易明细实时查询。随着互联网金融的发展,交易的频度和复杂性也随之快速增长,域名注册,交易数据源源不断产生,如何提供高质量的数据查询服务,满足客户全天候、场景化且实时性的数据访问需求,成了数据管理的核心命题。

业务交易数据产生于各自的交易系统(如核心系统),并通过交易系统提供当日数据的查询服务。采用Hadoop集群进行历史数据存储,历史交易数据通过数据交换平台获取,通过批量方式每日执行数据导入,数据导入过程支持数据校验和异常数据清洗,清洗处理后的交易数据采用实时数据库HBase作为存储容器,保存业务系统历史交易数据。对外提供了交易数据统一查询服务,覆盖交易系统中的当日交易数据和HBase中的历史交易数据,对终端用户提供统一的数据访问视图。

基于以上这些典型应用场景,依托大数据技术可实现风险实时管控、产品精准营销、支持商业智能决策分析、海量知识快速检索,更好地让数据服务业务发展。目前,农行正在逐步构建从采集、存储、分析、展现到应用的全流程数据服务体系,而在打造全行数据平台的过程中,还需要着重关注以下问题:

第一,价值驱动,架构先行。数据的存储和管理是手段,目标是获取数据的价值。一切对于数据的管理均应基于其价值,对于价值密度高的账户类、交易类数据,不仅要管理好,还要利用好,建立数据间的关联,挖掘潜在的价值。对于数据中台的建设,要坚持架构先行,确立整体数据架构,通过数据治理等手段,加强数据模型的统筹管理,提升数据质量,并结合服务接口管控,提升数据服务能力,逐步实施架构演进,打造数据领域的开放平台。

(责任编辑:梦飞科技)

扫描二维码

关注梦飞科技最新资讯