成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
向量连接世界,Zilliz 举办首届非结构化数据峰会
2022 年 9 月 29 日
CSDN
随着 5G 时代的到来,大数据分析和应用得到了各个行业的广泛关注,各种新的应用也时刻产生巨量的非结构化数据,如何工具化、平台化、规模化地使用这些非结构化数据,成为企业关注的焦点。
9 月 24-25 日,刚融资 6000 万美元的向量数据库公司 Zilliz 出品的 2022 首届非结构化数据峰会成功举行,本届峰会以“矩阵革命——向量连接世界”为主题,Zilliz 核心产品和研发团队携手来自金融、人工智能、互联网等多领域的专家,分享了以向量数据库为代表的非结构化数据处理技术发展与应用实践。
Zilliz Cloud:非向量数据库产品家族新成员
作为向量数据库包括非结构化数据领域的先行者,Zilliz 一直在探索如何管理、使用、快速价值化非结构化数据,从而赋能企业提效增益。
Zilliz 创始人兼首席执行官星爵表示,非结构化数据已经占数据总量的 80%以上,未来几年增速将会超过结构化数据。但与此同时,非结构化数据的价值目前还远未充分挖掘,Zilliz 会继续深耕在向量数据处理领域的能力,包括数据的可观测性、工作流管理、数据安全、数据隐私、数据应用等层面。如今,Zilliz 在非结构化数据处理的生态圈,已经贡献了 Milvus 和 Towhee 两个开源项目,在非结构化数据处理领域不断提供创新解决方案。
星爵
Zilliz 创始人兼首席执行官
言出必行,Zilliz 随即以此次峰会为契机,重磅发布了全新产品——Zilliz Cloud,为用户提供了一个新的云选项。
谈及推出 Zilliz Cloud 的初衷,Zilliz 合伙人和技术总监栾小凡这样解释:在非结构化数据领域,很多工具是散的,用户只能把各种各样的开源组件拼接起来使用,处理流程会比较繁琐,并且在稳定性、易用性方面还会遇到各种问题。
Zilliz Cloud 正是为了解决这些痛点而生,它是基于 Milvus 构建的一个能够托管的云服务,由最懂得做非结构化处理及向量检索的团队——Milvus 原班人马打造。Zilliz Cloud 具备高可用、成本优化、扩展性强等特点,能够打通数据之间的隔阂,完成数据的转换、分析、迁移、可视化等管理动作,更重要的是,通过这一系列操作,非结构化数据将被转化成可以检索的向量数据,从而为业务提供更大的价值。
Zilliz
产品家族图
面对新成员的华丽亮相,作为家族元老的 Milvus 和 Towhee 也不逞多让。
Milvus 是一个开源的分布式向量数据库,不但集成了业界成熟的向量相似度搜索技术,更在此基础上对高性能计算框架进行了大幅度优化。在即将推出的 Milvus 2.2 版本中,增加了磁盘索引(DiskANN)这一选项,相比于传统的纯内存索引方案,DiskANN 可以把用户的本地磁盘作为存储索引,牺牲少量的查询性能,但能换来成本的大幅降低,用户可以使用更低成本的具备 SSD 且内存更小的机器进行数据库部署。同时新版本还将增加数据批量导入、RBAC 权限控制、查询 Pagination、限流与反压等功能。
Towhee 是传统 ETL 工具覆盖能力的补充,相比传统 ETL,非结构化数据的 ETL 在业务侧的原始数据层更大、转换过程更加面向深层次语义、过程会引入大量 AI 能力。通过使用 Towhee,任何用户都能够基于 Python 代码一键构建面向生产的高性能非结构化数据处理流水线。未来,Towhee 将会持续得到优化和升级,比如在现有的 pipeline 定义接口上提供一个类似于 Spark、Flink 的流水线定义接口;同时将更加深入地集成类似英伟达这样的技术生态,进一步提升整个流水线面向生产的执行效率;也会不断努力满足社区用户的需求,解决中文模型的缺口。
眼花缭乱的非向量数据库应用场景
非结构化数据的不断增长,驱动着基于 AI 的非结构化数据分析与检索技术的不断发展。
据 Zilliz 合伙人和产品总监郭人通介绍,在应用生态层面,非结构化数据搜索在图片搜索、视频搜索、文本语义搜索、跨通道搜索、推荐/问答系统、版权保护、欺诈检测、数据查重、网络安全、药物发掘、异常检测等场景有着良好的应用前景;在行业生态层面,当前非结构化数据生态的基础软件和工具远远少于结构化数据生态,未来有着非常广阔的增长空间。
技术的应用离不开不同行业的实践,多位嘉宾从各自业务出发,通过实际问题剖析,阐述了如何有效地提取非结构化数据的语义信息,如何实现大规模、高精度、高吞吐的非结构化数据分析与检索。
中国电信翼支付风控总监汤敏伟分享了翼支付如何利用 Milvus 构建更加智能的金融风控体系;
百度资深研发工程师方泽阳分享了 Milvus 语义索引库如何帮助百度飞桨 PaddleNLP 提高语义检索的精准性;
虎牙安全算法高级研究员黎官钊分享了 Milvus 如何帮助虎牙团队快速进行敏感区域特征识别与检索,提高视频内容安全审查效率;
陌陌数据平台资深专家孔云龙分享了 Milvus 如何帮助陌陌进行垃圾信息甄别、假照识别等。
金融支付、深度学习、视频直播、社交……Milvus 在越来越多的领域实践落地和发挥价值,这让我们近距离感知到了非结构化数据和向量检索的极大发展空间,也对于打破数据孤岛,实现优质数据互联互通更加有信心。
“单丝不成线,孤木不成林”,纵深挖掘非结构化数据潜能意义重大。2022 首届非结构化数据峰会,给我们展示了一张非结构化数据处理技术进展与实践成果的全景图。面向未来,Zilliz 也发出倡议,希望借助本次峰会达成共识,经验共享,创新共创,与更多的开发者、生态伙伴、创业公司一起探索,推动向量数据库在各行各业的应用,共建非结构化数据的美好未来。
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
非结构化数据
关注
0
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
46+阅读 · 2022年8月20日
244页pdf!《2022 中国云计算生态蓝皮书》发布
专知会员服务
108+阅读 · 2022年8月3日
【SIGIR2022教程】深度知识图谱表示学习: 补全、对齐和问答
专知会员服务
36+阅读 · 2022年7月17日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
42+阅读 · 2022年4月15日
《华为云数据库在金融行业的创新与探索》华为26页PPT
专知会员服务
12+阅读 · 2022年3月23日
腾讯:2022年十大数字科技应用趋势
专知会员服务
80+阅读 · 2022年1月13日
重磅 |《企业数字化转型白皮书(2021版)》发布!83页pdf
专知会员服务
162+阅读 · 2021年11月11日
【KDD2020】图神经网络的无冗余计算
专知会员服务
37+阅读 · 2020年11月24日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
「非结构化数据峰会」精彩速递:Zilliz Cloud 首发、Milvus 技术演进、生态实践全揭秘!| Q推荐
InfoQ
1+阅读 · 2022年9月28日
开源国际化不是技术人创业的万能药|开谈
CSDN
0+阅读 · 2022年8月26日
源自中国顶级开源软件再下一城!向量数据库公司Zilliz完成6000万美元B+轮融资
CSDN
0+阅读 · 2022年8月25日
聚焦云原生大数据实践,首届腾讯云大数据峰会即将召开 | Q推荐
InfoQ
0+阅读 · 2022年8月17日
一元初始 万象融合 - Google Cloud 2022 中国出海数字峰会回顾
谷歌开发者
0+阅读 · 2022年1月24日
云计算时代,国产数据库厂商如何“弯道超车”?| 直播推荐
InfoQ
0+阅读 · 2022年1月13日
云计算时代,国产数据库厂商如何“弯道超车”?|直播推荐
AI前线
0+阅读 · 2022年1月13日
共赴 Google Cloud 2022 中国出海数字峰会,探索更多可能
谷歌开发者
0+阅读 · 2022年1月6日
数据中台与湖仓一体能碰出怎样的火花?网易数帆实时数据湖Arctic的新探索
AI前线
0+阅读 · 2021年12月18日
Kyligence 完成 D 轮 7000 万美元融资,加速国际化布局
极客邦科技Geekbang
0+阅读 · 2021年4月21日
支持可扩展事务处理的数据库日志机制及其实现
国家自然科学基金
0+阅读 · 2015年12月31日
基于互联网海量信息的数据库文本类型数据清洗研究
国家自然科学基金
0+阅读 · 2013年12月31日
面向位置偏好查询的移动P2P数据库构建及算法研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于几何计算的可视媒体数据特征提取方法研究
国家自然科学基金
1+阅读 · 2012年12月31日
基于云架构的物联网传感器数据管理技术研究
国家自然科学基金
3+阅读 · 2012年12月31日
基于草图的地理信息检索理论与方法研究
国家自然科学基金
1+阅读 · 2012年12月31日
云计算Hadoop框架中高效迭代机制的研究
国家自然科学基金
0+阅读 · 2012年12月31日
非合作环境下结构化数据的深层关键词搜索
国家自然科学基金
0+阅读 · 2012年12月31日
基于语言模型的通用实体检索建模及框架实现研究
国家自然科学基金
6+阅读 · 2011年12月31日
大规模非结构化数据的智能存储管理与检索关键技术
国家自然科学基金
6+阅读 · 2010年12月31日
Bit-Interleaved Coded Energy-Based Modulation with Iterative Decoding
Arxiv
0+阅读 · 2022年11月23日
Python Implementation of the Dynamic Distributed Dimensional Data Model
Arxiv
0+阅读 · 2022年11月22日
Edge Multiway Cut and Node Multiway Cut are NP-complete on subcubic graphs
Arxiv
0+阅读 · 2022年11月22日
Cross-Modal Object Tracking: Modality-Aware Representations and A Unified Benchmark
Arxiv
14+阅读 · 2021年11月11日
Federated Causal Inference in Heterogeneous Observational Data
Arxiv
24+阅读 · 2021年8月10日
Subgraph Neural Networks
Arxiv
27+阅读 · 2020年6月19日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Hierarchical Graph Pooling with Structure Learning
Arxiv
13+阅读 · 2019年11月14日
K-BERT: Enabling Language Representation with Knowledge Graph
Arxiv
19+阅读 · 2019年9月17日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
非结构化数据
结构化数据
结构化
结构
数据库
大数据分析
相关VIP内容
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
46+阅读 · 2022年8月20日
244页pdf!《2022 中国云计算生态蓝皮书》发布
专知会员服务
108+阅读 · 2022年8月3日
【SIGIR2022教程】深度知识图谱表示学习: 补全、对齐和问答
专知会员服务
36+阅读 · 2022年7月17日
实时数据湖在字节跳动的实践
专知会员服务
29+阅读 · 2022年5月28日
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
42+阅读 · 2022年4月15日
《华为云数据库在金融行业的创新与探索》华为26页PPT
专知会员服务
12+阅读 · 2022年3月23日
腾讯:2022年十大数字科技应用趋势
专知会员服务
80+阅读 · 2022年1月13日
重磅 |《企业数字化转型白皮书(2021版)》发布!83页pdf
专知会员服务
162+阅读 · 2021年11月11日
【KDD2020】图神经网络的无冗余计算
专知会员服务
37+阅读 · 2020年11月24日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
热门VIP内容
开通专知VIP会员 享更多权益服务
军用数据链:武器装备神经,联合作战基石,31页pdf
【ETHZ博士论文】超越像素深度:通过深度学习增强超分辨率技术,198页pdf
2018∼2023年国家自然科学基金人工智能学科人才项目申请及资助综述
【NeurIPS2024】《AmoebaLLM:构建任意形状的大型语言模型以实现高效和即时部署》
相关资讯
「非结构化数据峰会」精彩速递:Zilliz Cloud 首发、Milvus 技术演进、生态实践全揭秘!| Q推荐
InfoQ
1+阅读 · 2022年9月28日
开源国际化不是技术人创业的万能药|开谈
CSDN
0+阅读 · 2022年8月26日
源自中国顶级开源软件再下一城!向量数据库公司Zilliz完成6000万美元B+轮融资
CSDN
0+阅读 · 2022年8月25日
聚焦云原生大数据实践,首届腾讯云大数据峰会即将召开 | Q推荐
InfoQ
0+阅读 · 2022年8月17日
一元初始 万象融合 - Google Cloud 2022 中国出海数字峰会回顾
谷歌开发者
0+阅读 · 2022年1月24日
云计算时代,国产数据库厂商如何“弯道超车”?| 直播推荐
InfoQ
0+阅读 · 2022年1月13日
云计算时代,国产数据库厂商如何“弯道超车”?|直播推荐
AI前线
0+阅读 · 2022年1月13日
共赴 Google Cloud 2022 中国出海数字峰会,探索更多可能
谷歌开发者
0+阅读 · 2022年1月6日
数据中台与湖仓一体能碰出怎样的火花?网易数帆实时数据湖Arctic的新探索
AI前线
0+阅读 · 2021年12月18日
Kyligence 完成 D 轮 7000 万美元融资,加速国际化布局
极客邦科技Geekbang
0+阅读 · 2021年4月21日
相关基金
支持可扩展事务处理的数据库日志机制及其实现
国家自然科学基金
0+阅读 · 2015年12月31日
基于互联网海量信息的数据库文本类型数据清洗研究
国家自然科学基金
0+阅读 · 2013年12月31日
面向位置偏好查询的移动P2P数据库构建及算法研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于几何计算的可视媒体数据特征提取方法研究
国家自然科学基金
1+阅读 · 2012年12月31日
基于云架构的物联网传感器数据管理技术研究
国家自然科学基金
3+阅读 · 2012年12月31日
基于草图的地理信息检索理论与方法研究
国家自然科学基金
1+阅读 · 2012年12月31日
云计算Hadoop框架中高效迭代机制的研究
国家自然科学基金
0+阅读 · 2012年12月31日
非合作环境下结构化数据的深层关键词搜索
国家自然科学基金
0+阅读 · 2012年12月31日
基于语言模型的通用实体检索建模及框架实现研究
国家自然科学基金
6+阅读 · 2011年12月31日
大规模非结构化数据的智能存储管理与检索关键技术
国家自然科学基金
6+阅读 · 2010年12月31日
相关论文
Bit-Interleaved Coded Energy-Based Modulation with Iterative Decoding
Arxiv
0+阅读 · 2022年11月23日
Python Implementation of the Dynamic Distributed Dimensional Data Model
Arxiv
0+阅读 · 2022年11月22日
Edge Multiway Cut and Node Multiway Cut are NP-complete on subcubic graphs
Arxiv
0+阅读 · 2022年11月22日
Cross-Modal Object Tracking: Modality-Aware Representations and A Unified Benchmark
Arxiv
14+阅读 · 2021年11月11日
Federated Causal Inference in Heterogeneous Observational Data
Arxiv
24+阅读 · 2021年8月10日
Subgraph Neural Networks
Arxiv
27+阅读 · 2020年6月19日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Hierarchical Graph Pooling with Structure Learning
Arxiv
13+阅读 · 2019年11月14日
K-BERT: Enabling Language Representation with Knowledge Graph
Arxiv
19+阅读 · 2019年9月17日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
大家都在搜
palantir
PRML
大型语言模型
空战战术
ETHZ博士论文
智能推荐
无人艇
汽车智能化
RE-NET
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top