你需要的不仅仅是数据,还有它们的复杂关系 | Q推荐

2020 年 7 月 20 日 InfoQ
图专家 Marko Rodriguez 说,数据库已经成为孤岛,这需要改变。

图作为一种全新的思维方式,其基于数据之间的关系将数据连接成网,以更多维的视角描述业务中的动态,挖掘数据中的隐藏价值。这种方式突破了传统数据分析在关联数据库中处理复杂数据关系的难点,降低了发掘数据价值的复杂度,为企业决策、技术实现提供了极大便利。

图分析使用图特定算法来分析实体之间的关系,大致可分为四类:路径搜寻、中心度、社区发现以及相似度算法。举个例子:

假设某个电商企业要打击刷单,可能已经有标记欺诈嫌疑人的资料信息或行为指标。但是,可能很难区分是异常活动还是欺诈行为。若是跟踪所有可疑的订单,既昂贵又会拖延业务,或者就只能让大多数有嫌疑的行为被忽视。
图算法(例如鲁汶算法)可用于更高级的社区检测,以发现不同级别的群体互动。例如,在刷单情况下,我们可能希望将紧密关联的帐户组与某个退货产品阈值相关联。我们可以使用 PageRank 算法来确定每个组中哪个帐户的收款交易总数最多,包括间接路径。

然而,图数据库可能包含大量节点,海量数据的来源可能是经过数十亿次的模拟、实验设备、互联网、应用等。对企业来说,需要把多个源头的数据整合、把子公司数据整合、把内外部数据整合等,这就需要企业建立新的计算平台架构、从 0 开始建立图分析模型,并引入新的处理算法和索引技术,这无疑对开发者的技术能力提出了挑战。根据 Gartner 的说法,“图数据存储可以跨数据孤岛有效地建模、探索和查询具有复杂关联关系的数据,但是目前需要专门技能限制了它们的采用。”

TigerGraph 最近推出了图平台的 3.0 Beta 试用版,使得图数据库和分析易于所有人使用。该版本中有几个优化后的工具值得探索:

  • 首先是可视化查询构建器(Visual Query Builder),这是需要重点关注的,该功能的推出填补了无代码图查询(no code graph querying)的业界空白,使图技术入门门槛进一步被降低;

  • 其次,对 GraphStudio 可视化开发工具进行升级,该工具为用户提供了可视化建模、可视化数据映射、数据加载进度监控、交互式图数据浏览和 GSQL 查询 IDE 的全栈可视化图业务开发环境。据相关报道描述,GraphStudio 是业界第一个全栈可视化图开发环境;

  • 此外,TigerGraph 还对图平台的图查询语言 GSQL 进行了优化,它是一个图灵完备的图查询语言,其图灵完备性是通过引入累加器、控制流、循环和递归调用实现的。由于这个原因,GSQL 理论上可以实现任何图算法。GSQL 已经被越来越多的企业所接受,并与 Cypher、Gremlin 形成三足鼎立的趋势。

诸如 Google、Facebook、LinkedIn 和 PayPal 之类的科技巨头都充分利用了图数据库的力量来创建蓬勃发展的业务。他们每个人都使用图数据库技术来深度洞察数据之间深度关联的价值。当今数据的数量和连接性的增加为持续的竞争优势提供了巨大的机会。企业相关决策者、业务人员、开发者需要立即着手对图分析的探索,并思考如何落地。

活动推荐:

面对图分析,很多企业因为高门槛的技术要求而无从下手,如果能在关系数据库中实现“No Code”迁移、如果能够在迁移完成后快速进行可视化数据建模、如果能够在分布式环境中实现关于图的简单快速部署,这将会让图分析的应用落地变得更简单,易操作。

以上这些内容都将在此次线上直播课程中一一得到解答。7 月 22 日下午 14:00-15:00,TigerGraph 解决方案工程师林选磊老师将空降直播现场,现场分享图分析能力是如何从高门槛进化到人人尽可用的全民化。帮助大家树立全面的图分析认知,于业务中释放图分析的真正价值。

扫 / 码 / 报 / 名

扫描上图二维码获点击阅读原文链接,即可免费报名参与课程!

登录查看更多
0

相关内容

【KDD2020】动态知识图谱的多事件预测
专知会员服务
127+阅读 · 2020年8月30日
专知会员服务
49+阅读 · 2020年8月27日
基于知识图谱的推荐系统研究综述
专知会员服务
328+阅读 · 2020年8月10日
【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文
专知会员服务
37+阅读 · 2019年11月3日
社区分享|如何让模型在生产环境上推理得更快
21个必须知道的机器学习开源工具!
AI100
13+阅读 · 2019年9月13日
学习开发知识图谱中的长期关系依赖
人工智能前沿讲习班
8+阅读 · 2019年6月10日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
【知识图谱】当知识图谱遇上聊天机器人
产业智能官
13+阅读 · 2017年11月10日
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
102+阅读 · 2020年3月4日
Area Attention
Arxiv
5+阅读 · 2019年5月23日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
Arxiv
7+阅读 · 2018年1月21日
VIP会员
相关VIP内容
相关资讯
社区分享|如何让模型在生产环境上推理得更快
21个必须知道的机器学习开源工具!
AI100
13+阅读 · 2019年9月13日
学习开发知识图谱中的长期关系依赖
人工智能前沿讲习班
8+阅读 · 2019年6月10日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
推荐|网易云音乐分析之推荐算法
人人都是产品经理
10+阅读 · 2018年2月26日
【知识图谱】当知识图谱遇上聊天机器人
产业智能官
13+阅读 · 2017年11月10日
相关论文
Talking-Heads Attention
Arxiv
15+阅读 · 2020年3月5日
Arxiv
102+阅读 · 2020年3月4日
Area Attention
Arxiv
5+阅读 · 2019年5月23日
Self-Driving Cars: A Survey
Arxiv
41+阅读 · 2019年1月14日
Arxiv
7+阅读 · 2018年1月21日
Top
微信扫码咨询专知VIP会员