关于要用到哪些数据,这些完全是业务需求所决定的。至于技术上,我觉得如果要做实体与账户实体的关系,这最好用到知识图谱,如果不做知识图谱,纯做实体画像,就要把账号信息挂靠在实体属性中,这样的做法不太灵活,具体实现还是要看您的业务需求而定。如果用到知识图谱,我觉得最好使用图...
显示全部关于要用到哪些数据,这些完全是业务需求所决定的。至于技术上,我觉得如果要做实体与账户实体的关系,这最好用到知识图谱,如果不做知识图谱,纯做实体画像,就要把账号信息挂靠在实体属性中,这样的做法不太灵活,具体实现还是要看您的业务需求而定。如果用到知识图谱,我觉得最好使用图数据库,比如neo4j,但是在大数据量下性能会衰减得比较严重,也可以使用hbase存储实体关系。Elasticsearch对于存储实体画像,用于多维度检索效果很好。Spark可以当做实体与关系构建的计算引擎,也可以使用mapreduce计算。整个过程比较复杂,在这里只能说下流程和基本技术点。
收起