金融科技Fintech

最专业的金融科技服务,为您量身定制金融解决方案

您现在的位置:首页 » 金融科技 » 云服务

证券云服务平台

     金赞国际证券云服务平台主要包括数据服务云和运营后台云两部分。数据服务云基于证券行业用户两大刚需,即行情与中心,提供包含行情信息,数据信息以及中心信息等服务运营后台云基于对产品整体运营以及效果的反馈与监控提供服务,主要包含数据统计工具、用户push、用户画像和智能客服等服务。

     1. 证券云底层技术架构

     1.1 框架介绍

     基于腾讯开源的Tars,证券云是支持多语言的高性能RPC开发框架和配套一体化的服务治理平台,以微服务的方式快速构建稳定可靠的分布式应用,证券云服务平台基于 TAF框架开发。

     1.2 框架设计思路

     底层协议层:将网络通信协议进行统一,支持多平台、可扩展、协议代码自动生成的统一协议。这样技术人员在开发过程中只需要关注通讯的协议字段内容,不需要关注其实现的细节

     中间公共库、通信框架、平台层公共库从使用者的角度出发,封装大量日常开发过程中经常使用的公共库代码,让开发更简单方便。通信框架从框架本身角度出发,做到高稳定性、高可用性、高性能。平台层解决服务运营过程中遇到的容错、负载均衡、容量管理、就近接入、灰度发布等问题,让平台更加强大

    顶层运营层运营层让运维人员只需关注日常的服务部署、发布、配置、监控、调度管理等操作,让运维更加高效。

    1.3 整体结构

    1.4 后台代码结构

    1.5 开发步骤

    2. 数据服务云

    2.1 行情服务

    2.1.1 行情服务架构

  • 行情接入:行情数据的数据源均由交易所提供,如A股行情分别由上交所和深交所行情网关提供,分为Level-1和Level-2两档数据,包括指数、A股、B股、基金、债券的行情;
  • 行情转码接入交易所行情数据、优品财务数据与优品板块数据并进行处理,生成终端所使用到的大多数行情数据。转码机生成三大类数据:基础行情数据、板块行情数据、个股资金数据;
  • 主站:主站接收转码机生成的数据,储存并管理数据,同时主站相应客户端的数据请求,返回给客户端相应的数据内容。主站提供历史行情数据、实时行情数据以及一些简单指标的计算如量比、涨跌幅、振幅、委比、市盈率等。

    2.1.2 指标服务

    指标服务是通过指标管理平台中的指标公式,针对实时行情和历史行情进行计算从而得出指标计算机构。

  • 指标管理平台管理指标内容的平台
  • 行情服务:实时行情和历史行情,提供指标中所需要计算的数据源;
  • 计算服务提供指标计算的场所
  • 结果展示:将计算结果进行展示。

    2.1.3 选股服务

    选股是用户的一大刚性需求,选股服务在此基础上研发产生。

  • 指标选股通过指标平台中的指标设置条件进行选股的方式
  • 行情选股:结合实时L1/L2行情及历史行情数据进行选股的方式
  • 因子选股通过庞大的因子库进行选股的方式
  • 形态选股与相似K线:通过对K线的走势和形态在历史行情数据进行大数据运算得出选股方式

    2.2 数据信息服务

    2.2.1 数据库服务

    经过多年的数据积累,可以针对金融信息行业的数据提供数据库服务。

    金融数据库

  • 中国宏观数据库:为经济研究和媒体提供权威的数据支持,提供及时可靠的中国宏观经济数据包括国民经济核算、消费、投资、出口、金融、财政;
  • 沪深股票数据库为股票量化投资提供专业的数据支持,提供完整的沪深股票数据,包括基础信息、行情、权益、公司治理、交易数据、重大事件、财务数据、指标数据;
  • 港股数据库为香港股票投资提供专业的数据支持,提供全面的港股数据,包括证券资料、高管信息、权益披露、股本结构、融资分红、拆股合股、回购、沽空、沪港通、ADR、投行评级及盈利预测;
  • 美股数据库为美国股票投资提供专业的数据支持提供及时的美股数据包括基本资料、股本信息、董事会及高管、股权变动表和分红;
  • 新三板数据库:为新三板投资和投行咨询提供数据支持,提供新三板从挂牌到交易、融资、转板一系列数据,包括基本资料、股本股东、人力资源、分红、融资、重大事项、证券交易、行情、三板指数、财务报表和财务分析;
  • 中国基金数据库为基金投资与研究提供多维度数据支持,提供全面的中国基金市场数据包括基本信息、发行上市、开放式基金申购赎回、投资组合、基本行情、基金净值、 财务数据、分红拆分、持有结构、基金评级、公司统计和经理评价;
  • 中国债券数据库:为固定收益投资与研究提供精准数据服务,提供详实的中国债券市场数据,包括基础信息、权益、市场行情、主体财务数据、信用评级、指数数据、中外币市场利率和外汇数据;
  • 期货数据库为期货投资提供数据支持,提供可靠的中国期货市场数据。 包括合约信息、期货行情、期货库存和现货价格

    特色中心产品

  • 上市公司舆情库:上市公司舆情库从大数据角度运用文本分词检索技术,对互联网上广泛的中心、研报、公告、论坛、股吧、微博和微信公众号等进行扫描监测,重点关注上市公司及其行业、竞争对手、股东和董监高等,全方位监控上市公司各方面信息
  • 财经机构/人物库对海内外重要机构和知名人物进行唯一性编码,建立机构、人物、中心及上市公司之间的关联模型,实现从机构、人物角度挖掘市场投资机会。机构库涵盖政府部门、金融机构、上市公司等,人物库包括政府官员、商界精英、经济学家、上市高管和媒体记者等;
  • 上市公司互动问答:互动问答数据来源于全景网-投资者互动关系平台、上证E互动等官方披露源,每天实时更新。互动问答类型包含互动精华、传闻求证、路演访谈、最新提问等,分类 清晰,查找便捷。
  • 财经日历财经日历通过挖掘未来可能发生对板块或个股有重大影响的事件,向投资提示相关投资机会。事件范围涵盖会展会议、时政要事、政策规划、其他大事、数据发布、节庆活动和市场提示等
  • 7*24 财经中心直播:专注中国证券市场,全面监控各种财经新闻、股市中心,7*24小时不间断提供全方位的证券信息服务

    2.2.2 财务信息数据服务

  • 公告预处理:将公告内容抓取并进行基础内容的解析,包括区分公告类型,标记股票标签,公告基础信息等内容
  • PDF解析将预处理的公告内容进行智能化解析抽取,输出标准化内容
  • 数据存储根据解析的公告内容以及文件信息内容进行分类存储
  • 数据标准化:根据定义的标准化科目名称、标注科目配置、平衡校验公式,对智能解析并抽取完成的数据进行科目标准化,数值标准化以及财务平衡验证
  • 采编平台人工编辑平台是对智能自动化平台产出内容进行管理和保障数据正确性的基础,对于错误数据提供一种可人工干预的平台
  • 数据转换根据不同的需求内容,将智能处理成标准化数据进行转换,以提供实现对不同数据需求的满足

     智能解析核心技术

(1)PDF内容解析:业内领先的PDF转HTML解析技术,能够以HTML的格式高度还原原始PDF内容;

(2)自动分类基于公告标题及内容信息识别,能够自动对公告进行自定义分类;

(3)摘要自动提取:① 基于表格的摘要信息抽取:对于以表格形式为主要内容载体类型的公告,通过采用BM25算法对表格进行定位,然后对表格数据进行结构化,抽取关键表格指标,套用相关模板形成自动摘要;② 基于文本内容信息抽取:对于以文本形式为主要内容载体类型的公告,通过一套基于事件框架的内容抽取技术,对公告内容进行关键内容定位,再进行摘要抽取;

(4)利好利空判断::在公告摘要提取的基础上,结合公告分类,对公告的利好利空进行自动识别;

(5)财务报表数据结构化:① 基于PDF转HTML技术,将转换后的 HTML内容进行关键表格定位; 对于表格做进一步清洗整理,并自动识别表格项目; 根据公司定义的一套财务数据报表规范进行科目自动标准化处理;④ 标准化后的内容根据优品财务平衡校验公式进行自动科目平衡校验;

(6)研报解析:① PDF转SVG;② 利用SVG的文字坐标、文字字体以及图表信息,构建模型算法对正文切割进行重排,将PDF原文多栏分离;③ 对分离后的SVG再次转PDF进行内容文本解析,结合公告财务及摘要相关技术对研报关键信息解析抽取。

    2.3.3 个性化推荐系统

    推荐系统架构

 

    推荐系统核心功能 

  • 中心数据收集和处理
  • 用户兴趣画像
  • 内容推荐模型

    推荐系统核心技术   

  • 在线推荐模型:基于item-base思想优化改造的在线模型
  • 离线推荐模块:基于协同过滤+deep&&wide推荐模型

    3. 运营后台云

    3.1 统计工具

  • 统计数据开发:统计数据通过日志ETL服务,计算任务配置平台进行处理
  • 计算服务:包含KafkaSpark计算组件,Hive计算组件,集群管理,监控邮件通知
  • 数据存储包含线上日志和业务数据
  • 内容展示:产品运营人员通过统计数据展示平台查看统计数据。

    3.2 用户推送系统

    推送系统自上而下,依次分为接入层、逻辑层、数据层和相关支撑服务。

    客户端接入

  • 开发自己的接入调度服务
  • 优化接入层服务;
  • 动态心跳间隔

    消息下发

  • 保证消息下发达到率
  • 保证快速下发达到率
  • 针对复杂需求的消息适配。

    3.3 用户画像

  • 标签管理:标签管理包含创建标签库、存储标签库两部分;
  • 标签计算标签计算通过标签计算中台,定义计算节点(sqlspark、python),配置计算 流程,生成计划任务,API存储数据到标签库
  • 分组管理:分组配置及计算流程通过中台定义分组,读取标签,生成 Hive sql,计划任务定时执行分组sql,处理结果target_id

    客户画像的生产和应用共有 3 层:

  • 数据层:数据采集源主要包括股票相关数据、交易数据、客户操作日志数据以及第三方数据。
  • 标签层:该层主要包括标签体系构建,标签内容生产以及标签库优化与扩展三个方面,标签体系构建需要确定能够表征股票以及客户的维度指标以及各指标逻辑联系,尽量减少指标冲突与指标遗漏等问题,做到全面完整,主次分明等要求。
  • 业务应用层:业务应用需要将应用场景细致化、全面化。通常,客户画像产品主要应用到客户研究分析,客户运营管理,客户营销服务以及对产品内容运营等方面。从应用诉求出发,具体包括客户全景视图、客户研究报表、客户特征标签、客户产 品投递引擎等。

    3.4 智能客服

     智能客服基于人工客服的基础属性,利用大数据分析等技术进行智能化改造。整个系统自上而下由智能机器人平台,服务引擎及客服工作台三部分组成。其中涉及后台相关的模块均支持分布式部署,随着用户增长,可以通过扩容系统解决系统性能瓶颈。

     3.4.1 智能机器人平台

     智能机器人是用户进入客服系统的首先接触到的内容,可24小时在线处理问题,它包含通讯控制模块、服务接口模块、换肤功能、业务交互逻辑、机器人框架及核心模块等内容。

    3.4.2 客服工作台

    客服工作台是客服人员操作的主要平台,包含监控大屏,会话管理,质量检测,工作报表,工单中心,客服管理,知识库等。

    3.4.3 智能客服服务引擎

    服务引擎是智能客服的核心组成部分,包含服务控制接口,自动分词引擎,语义分析引擎,IM引擎,分析推荐引擎,场景应用模块,知识库检索及结构管理,运行框架等。

 

 

返回列表