“神人”or“闲人”?你的未来由AI与大数据决定

2018 年 12 月 6 日 AI100



12 月 6 日,北京新云南皇冠假日酒店,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2018 中国大数据技术大会(BDTC)首日议程圆满结束。


本次大会为期三天,共设置有 1 个 Keynote 主题演讲,13 个分论坛,共有超 140 多位海内外技术专家及知名企业、高校、科研院所代表组成的实力讲师团、上千名技术开发者参与,他们聚焦大数据学习发展中的痛点及瓶颈,深入解析热门技术在行业中的实践和落地,紧贴时代脉搏,开启了一场属于技术人的年终盛宴。


大会首日上午,参加议程的大会演讲嘉宾有:


  • 阿里巴巴集团副总裁、2018 中国大数据技术大会主席 李飞飞

  • 中国科学院院士、北京理工大学常务副校长、CCF 大数据专家委员会主任 梅宏

  • 华东师范大学副校长、教授、博士生导师、2018 中国大数据技术大会主席 周傲英

  • CCF 大数据专家委员会副秘书长、北京永信至诚科技股份有限公司高级副总裁 潘柱廷

  • 中国科学院院士、西安交通大学教授、清华大学双聘教授 管晓宏

  • 源码资本投资合伙人 张宏江

  • 美国俄亥俄州立大学教授 张晓东


圆桌论坛:大数据与数字经济发展趋势


  • 主持人:CSDN创始人&董事长 极客帮创投创始合伙人 蒋涛

  • 嘉宾(排名不分先后):

  • 美国罗格斯-新泽西州立大学正教授、百度商业智能实验室主任 熊辉

  • 美国俄亥俄州立大学 Robert M. Critchfield 讲席教授 张晓东

  • 联通大数据有限公司总经理 赵越

  • 阿里巴巴集团副总裁 李飞飞


上午 9 点,李飞飞、梅宏和周傲英做了大会致辞后,上述海内外产学研界的重磅嘉宾陆续做了大数据技术和趋势发展分享,最后四位嘉宾在圆桌论坛上就大数据与数字经济发展趋势进行了热烈讨论。以下为诸位技术专家演讲的精华内容,由 AI科技大本营整理:


七大技术权威亮相主会,指明大数据时代新趋势


潘柱廷:大数据已成为所有新旧技术的必备基础



他介绍了 CCF 大数据专家委员会对 2019 年大数据发展的十大预测,并从学科、技术、系统、应用等方面进行了详细解读。在大数据应用领域方面,医疗、智慧城市、金融应用比例排在前三位;数据类型方面,城市数据、视频/语音数据、互联网公开数据占比依次最高;数据获取及资源流转方面,企业还是会选择自己收集数据提供服务;数据科学、人工智能、智能计算仍是大数据的最佳拍档;大数据发展的主要推动者还仅来自于大型互联网公司和政府机构。


潘柱廷指出,绝大多数参与调研的专家学者认为大数据发展仍处于快速扩展期。另外,从辅助到引领,从热点变支点,大数据和数据已经成为所有新旧技术、新旧模式的必备基础。


管晓宏:数据驱动信息物理融合系统信息安全



管晓宏提出,CPS(信息物理系统) 被公认为下一次工业革命的重要基础,无论是德国提到的工业 4.0 还是美国竞争力计划,都表明建设大规模信息物理基础设施是国家重大战略需求。同时他指出,信息物理融合系统安全监控面临三重挑战:如何建立针对 CPS 安全的模型,如何利用 CPS 多源数据的关联关系,如何处理 CPS 异构大数据。


管晓宏表示,CPS 基础设施的安全是事关国民经济稳定发展和国家安全、信息安全与相关交叉领域的重要发展方向;CPS 安全通常涉及综合安全,解决 CPS 安全监控需要深入了解物理系统的结构与特性,需要多学科交叉和通力合作;CPS 数据是典型多源异构大数据,而物理-信息数据的关联融合是解决 CPS 安全问题的重要手段。


张宏江:AI 再风光,核心依然是数据



张宏江表示,今天 AI 第三次浪潮来得如此之快与猛,背后的驱动力在于大数据、强计算、新算法的改良与突破,并且缺一不可,比如即使有再好的算法,但如果计算量上不去依然无法实现 AI。今天 AI 能获取的数据精度已经远远超过人类,这背后的核心是计算力的提高,更重要的是数据量与质量的提升,算法的精度和数量正相关。 张宏江警示称,AI 再火再风光,背后的核心依然是数据。


今天乃至未来 AI 到底到什么地步?张宏江概括为辅助人、代替人、超越人。对于最后一点也许心理上还有些难以接受,比较极端的说法是这个世界上将只有两种人,即神人与闲人。


张晓东:后摩尔定律时代需明确未来系统特性



摩尔时代过渡到后摩尔时代究竟遇到了怎样的挑战?张晓东认为,本质上明确未来系统的特性十分重要。 未来所有的计算放到 Memory 当中,也就是 Memory IN Memory,将会有 NVM 和 BDTC,也就是 CPU 变成了 New Memory。这需要年轻软件工程师们必须做出一个新的生态环境,最终用户说一句话就能让计算机做出相应反应,系统则会自动调用适合的 GPU 来接手工作。


熊辉:AI 时代缺乏跨界型人才



熊辉提到,数据驱动的人工智能时代,一定要考虑到技术、数据、应用场景之间的三角形循环。在中国,当前落地最大的问题是缺乏跨界型人才,人才要有非常丰富的专业支持,且技术要强,不然根本不知道哪些应用问题可以被解决。


李飞飞:大数据结合实体经济非纯技术领域问题



李飞飞表示,大数据与实体经济的结合已经不是一个纯技术领域的问题,这其中牵扯到对传统行业的改造,比如数据源打通、行业系统升级改造等,我们需要考虑以最少侵入式的改动使传统行业接收数字经济的理念并享受到相应好处。


李飞飞也分享了自己做技术的经验,技术浪潮会不断涌现,而且技术发展迭代非常迅猛,我们需要以兴趣来驱动而非目标驱动,找到自己最感兴趣的技术,将其做深、做透。


赵越:大数据实践最主要的是挖掘数据价值



赵越表示,经过几年的大数据实践,最大的挑战主要还是怎样从庞大的数据量中发掘价值十分关键。 如何把数据变成价值需要耐心,并学会高效与产学研结合,也更需要真正的大数据人去挖掘。


上午议程结束后,北京理工大学常务副校长、CCF大数据专家委员会主任梅宏院士和华中科技大学金海教授亲临现场进行签名赠书,现场气氛火爆异常。


     

七大业界专家纵论应用,阐述大数据技术落地思维


本次大会聚焦于大数据技术如何更好的服务于实体经济,关注热门技术在行业中的实践和应用。而下午的重磅演讲嘉宾则清一色来自产业界,主要围绕大数据技术的应用落地。从其演讲内容来看,某种程度上,他们为“从辅助到引领,从热点变支点,大数据和数据已经成为所有新旧技术、新旧模式的必备基础”提供了绝佳注脚。


以下为参加下午议程的演讲嘉宾:


  • Alluxio 公司创始人、CEO 李浩源

  • 阿里巴巴集团副总裁 周靖人

  • 普元软件产品部总经理 王葱权

  • 北京信息科学技术研究院副院长 陈性元 

  • 京东云生态业务部高级总监 朱冰

  • 中移软件大数据部总经理助理 王宝晗

  • 易观 CTO 郭炜


    李浩源:统一化分布式虚拟文件系统



    数据时代最重要的资产其实是数据本身,但最重要的任务在于如何最大化、最有效地从数据中提取价值。


    李浩源指出,数据生态初期的 1.0 架构面临着三大痛点:复杂、低性能以及高成本。而大数据时代的 2.0 架构则提出了整合数据、Memory-first、Native APIs、Multi-hybrid Cloud 这四点需求。曾经整个存储行业都在重复同一个故事,每 3 至 8 年就会有新一代存储的软硬件诞生,随着上一代的不断革新,自然数据的环境也日益复杂。面对挑战,他们提出了虚拟整合文件系统(A Virtual Unified File System)的观点。


    周靖人:阿里已远远超出电商平台范畴



    周靖人表示,阿里已经远远超出电商平台的范畴,广泛涉及支付、广告、娱乐等诸多业务,这些业务都离不开数据分析和数据智能的支持。这些业务背后都有流计算、图计算、机器学习等技术的支持。周靖人还介绍了这些技术在阿里的具体应用,比如淘宝的个性化体验,系统可以根据用户的历史行为,实时地为每个人提供个性化的搜索结果,而且淘宝已经可以做到基于场景的推荐。


    王葱权:数字化时代需要大数据应用平台架构



    面对数字化浪潮,王葱权认为传统的实体经济是根据物理的生产资料来做,其数量是有限的,而数字经济是数字和信息,未来的规模会远远超过实体经济。让企业从独立走向生态是数字化时代的必然结果,未来没有一个企业是独立的。什么样的企业会成为生态?数据即是企业走向生态的基础,但现代企业面临着搞不清究竟有多少核心数据资产,并且面临数据质量不高、业务开发难协作、数据应用无体系等数据问题。


    此外他提出,针对面向治理的大数据应用平台架构建设有五大重点:闭环数据应用、端到端服务开发、全链路共享数据服务、安全统一数据网关和服务接口标准化。在数字经济时代,我们需要一个面向治理大数据应用平台,且需围绕“盘-规-整-用”,建立起“采集、开发、管理与服务”一体化平台。


    陈性元:存储平台安全是平台安全的重中之重



    大数据安全目前面临的主要挑战包括防护水平与担负的时代使命不相适应;监管能力与所处的重要地位不相适应,大多利用传统方法,监管不到位;共享程度与应发挥的重要作用不相适应,面对大数据共享,每每陷入不愿、不敢、不能的尴尬境地。要想解决大数据在上述三个方面的安全问题,首先就要有一个技术框架,大数据的技术框架有很多,主要包含两类,一类面向业务流程,一类是面向系统架构。但现有技术框架存在两大问题,一是过于复杂,二是难于操作。


    谈及大数据安全技术框架,陈性元重点介绍了大数据的平台安全,同时他指出存储平台的安全是整个平台安全的重中之重。目前关于存储安全主要涉及数据加密,以及数据的完整性证明。和,演讲最后,陈性元还围绕大数据安全技术发分享了一些个人看法。他首先指出根本出路在于用密码技术解决大数据安全;而利用区块链这一新途径也不失为一种有效的方法,但切忌人云亦云,要展开创新研究;用数据世系技术解决问题;用大数据技术解决大数据安全态势感知问题。


    朱冰:在虚拟世界实现模拟计算



    朱冰认为,在现实世界中的任何一个实体,在虚拟世界都有一个对应的虚拟实体, 通过云计算、大数据、AI 等技术,人们能够在虚拟世界实现模拟计算,大大加速现实世界中的技术革新和产业变革,不断成熟的技术与应用让我们还有很多畅想的空间。


    王宝晗:中国移动的“大连接” 战略



    王宝晗称,目前中国移动有 9.16 亿移动端用户,+1.47 亿家庭宽带用户,+300 万基站,带来每天超过 60PB 的网络数据和运营管理数据。数字化时代,基于云、管、端基础设施实现人和物的“普遍连接”成为最重要的特征,中国移动基于此背景在 2016 年确定“大连接” 战略,正式启动了全网统一的大数据平台建设,总体目标是搭平台、聚数据、强管控、建生态。


    搭平台是依托资源池建立集中化分布式集群;聚数据把中国移动各省的数据做融合,另外也融合外部行业的优质数据;强管控就是数据不出系统,系统不出移动;建生态是面向社会各界提供开放平台服务,共同建设面向大连接的大数据开放生态。 未来,中国移动将以数据能力开放为核心,通过多租户、安全隔离的方式提供数据资源、基础平台、数据处理和应用开发能力,驱动数据价值挖掘和对外应用合作创新。


    郭炜:IOTA 数据架构是新一代计算架构



    郭炜表示,今天我们依然面对着大数据‘大而不强’、人工智能‘人工’而不‘智能’的现状,随着数据积累越来越多,发现数据湖已经变成了数据的沼泽,需要花费大量的时间清洗出来。同时,CTO/CIO 在大数据方面面临着人才缺失、存储不够、业务分析多变难以满足、各端繁杂不统一、数据量级庞大等挑战。而 IOTA 数据架构就是基于边缘计算的适用于大数据和人工智能新一代的计算架构,郭炜在现场详细讲解了 IOTA 数据架构的特性,比如去 ETL 化架构、非结构化实时结构化为 SQL 数据存储、支持 IOT 设备与现有移动端数据融合、支持边缘 AI 实时反馈等。

         

    精彩技术分享继续


    随着信息技术的迅猛发展,数据的重要性和价值已毋庸置疑,数据正在改变竞争格局,成为重要的生产要素,更被定义为“21 世纪的新电力”。在信息高速传播的今天,数据已经渗透到每一个行业和业务职能领域,指数级的速度增长将我们带入大数据时代。随着大数据的蓬勃发展,身处潮流旋涡中的开发者们更是亟待窥探大数据技术前沿和行业的整体发展动向。


    12 月 7-8 日,大数据大会还有 13 个技术和行业分论坛:大数据分析与生态系统论坛、深度学习论坛、大数据可视分析论坛、推荐系统论坛、大数据安全与政策论坛、精准医疗大数据论坛、数据科学与大数据技术教育论坛、数据库论坛、金融大数据论坛、知识图谱论坛、工业大数据论坛、区块链论坛、交通与旅游大数据论坛。


    点击【阅读原文】,查看详细议程,精彩分享不容错过。现场见!


    另外,没到现场的小伙伴可以查看下方海报,一览大会第一天的精彩观点分享。(目前大会官网已更新部分PPT,扫描海报二维码即可下载)


    登录查看更多
    0

    相关内容

    从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
    报告 | 2020中国5G经济报告,100页pdf
    专知会员服务
    97+阅读 · 2019年12月29日
    电力人工智能发展报告,33页ppt
    专知会员服务
    128+阅读 · 2019年12月25日
    2019中国硬科技发展白皮书 193页
    专知会员服务
    82+阅读 · 2019年12月13日
    【大数据白皮书 2019】中国信息通信研究院
    专知会员服务
    137+阅读 · 2019年12月12日
    2019年人工智能行业现状与发展趋势报告,52页ppt
    专知会员服务
    121+阅读 · 2019年10月10日
    分布式智能计算系统前沿
    中国计算机学会
    19+阅读 · 2019年10月8日
    为什么说深耕AI领域绕不开知识图谱?
    人工智能学家
    33+阅读 · 2019年5月30日
    CCFTF17(上海):认知计算产业化如何落地
    中国计算机学会
    4+阅读 · 2019年4月28日
    【工业大数据】李杰:工业大数据的前半生和后半生
    产业智能官
    6+阅读 · 2017年11月30日
    Meta-Learning to Cluster
    Arxiv
    17+阅读 · 2019年10月30日
    A Sketch-Based System for Semantic Parsing
    Arxiv
    4+阅读 · 2019年9月12日
    Arxiv
    18+阅读 · 2019年1月16日
    Arxiv
    4+阅读 · 2018年5月14日
    VIP会员
    Top
    微信扫码咨询专知VIP会员