xx资源网(xxURLs.com)
发布资源

块数据,大数据战略重点实验室 2015.4 【pdf mobi epub txt非扫描】




《块数据4.0:人工智能时代的激活数据学》由中信出版社出版。

媒体推荐

大数据时代,对未来不确定性和不可预知性进行精准的研判,是块数据实践过程中迫切需要解决的关键问题。正是在这一背景下,《块数据4.0》针对此问题进行了深入研究与实践探索,创造性地提出了激活数据学的理论和实践体系,并在一些重要领域开始了系统性探索。

——美国《美华商报》

面对超数据时代带来的数据拥堵难题,《块数据4.0》运用激活数据学有效挖掘、分析大数据背后的人的运行规律,把超数据从“厚”做到“薄”,从“大”做到“小”,为大数据时代清除认知障碍,平衡利益矛盾,让不确定性对抗确定性成为可能。

——西班牙《侨声报》

《块数据4.0》提出场景驱动可以帮助决策者更敏锐的洞悉事件根本,产生更精准更智慧的决策,实现场景应用的遂人愿、知人意。激活数据作为优质数据可以满足场景驱动对数据维度和质量的要求,引发人体和人脑联网的狂潮之后,人类将越来越自由自在地进行社会活动。

——澳大利亚《联合时报》

《块数据4.0》将激活数据学与人工智能进行了融合创新,并分别聚焦到自动驾驶、城市大脑、医疗影像、智能语音四大应用场景中,激活数据学的基础是人工智能的飞速发展,它能驱动人工智能的研究和应用取得突破性进展。

——罗马尼亚《欧洲侨报》

数据搜索、关联融合、自激活、热点减量化、群体智能是激活数据学的五个运行阶段,构成了激活数据学模型化运行的完整流程。激活数据学的提出,标志着大数据领域和人工智能领域研究取得了新突破,块数据理论跨越了又一个新的理论高度。

——印度尼西亚《国际日报》

作者简介

大数据战略重点实验室成立于2015年4月,是由贵阳市人民政府和北京市科学技术委员会共建的跨学科、专业性、国际化、开放型研究平台,是中国大数据发展新型高端智库。

目录

绪论大数据时代的解决方案

第一章超数据时代的数据拥堵

第一节小数据时代、大数据时代和超数据时代

(一)小数据时代

(二)大数据时代

(三)超数据时代

第二节奇点来临:数据大爆炸

(一)数据连接型社会:数据量化世界

(二)数据大爆炸:海量、复杂与失控

(三)数据失真、数据依赖与数据安全

第三节数据拥堵与数据治理

(一)数据拥堵的由来

(二)从生命周期视角思考数据拥堵

(三)数据拥堵的治理范式

第二章激活数据学:基于块数据理论的解决方案

第一节复杂理论与块数据

(一)复杂性的涌现

(二)块数据的数据观

(三)数据学与数据科学

第二节激活数据学的提出

(一)激活数据学的由来

(二)激活数据学的理论框架

(三)激活数据学的时代价值

第三节激活数据学与数据激活机理

(一)数据搜索:智能感知

(二)关联融合:智能聚合

(三)自激活:智能决策

(四)热点减量化:智能筛选

(五)群体智能:智能碰撞

第三章数据搜索:智能感知

第一节智能感知与交互

(一)生物感知

(二)机器感知

(三)交互识别

第二节搜索引擎:连接人与信息

(一)从“寻物”到“搜数”

(二)谷歌搜索:让流动的信息产生智能

(三)搜索引擎的工作原理

第三节搜索引擎到人工智能的终极演进

(一)全局化范围搜索

(二)智能化目标识别

(三)无界化协同感知

第四章关联融合:智能聚合

第一节人脑信息的处理与融合

(一)对象感知

(二)情景关联

(三)信息融合

第二节智能数据处理

(一)大数据融合处理模式

(二)数据融合处理局限

(三)基于人脑模式的数据关联融合

第三节数据融合:构建新型数据关系

(一)降维去噪

(二)关联识别

(三)融合重构

第五章自激活:智能决策

第一节脑认知与类脑计算

(一)神经元与神经网络

(二)从学习到决策

(三)人脑智能决策对机器学习的启示

第二节让机器像人一样思考

(一)从“深蓝”到“阿尔法元”

(二)构造人工神经网络

(三)深度学习驱动机器智能决策

第三节智能判断与决策

(一)提取特征

(二)构建模型

(三)决策输出

第六章热点减量化:智能筛选

第一节遗忘,是为了更好的记忆

(一)人脑的记忆存储极限

(二)记忆的选择性封存

(三)遗忘也是一种学习

第二节删除,数据取舍之道

(一)数字记忆是生物记忆的延伸

(二)全面数字存储下的信息失控

(三)数字记忆与信息取舍

第三节筛选,选择最优决策

(一)数据匹配与简约

(二)优化算力配置

(三)选择最优算法

……

第七章群体智能:智能碰撞

第八章激活数据学的应用场景

第九章云脑时代:开启数字文明新纪元

参考文献

术语索引

后记

序言

眼看乾坤一局棋,满枰黑白子离离。

铿然一子成何劫,唯有苍苍妙手知。

这是被称为“波斯李白”的诗人奥马尔·海亚姆(1048—1122)的《鲁拜集》中的诗句。作为一名精通天文和数学的大学者,奥马尔认为,宇宙的规律是可以探知的,并可以用严密而美妙的数学方式表示出来。前定与随机,必然与偶然,向来是人文科学中长期争论不休的命题。自然科学理论始终受实验和观测的检验,而它的每一个重大发现又都会反馈到文化和社会的层面,对人的哲学和历史观有所启示。

决定性和概率性一直被当作数学、物理等学科对自然界的描述方式。在牛顿创立古典力学之后的250年间,直至20世纪20年代,决定论长期处于主导地位,基于概率论的统计描述或者说数据的描述,则一直属于不得已情况下所采用的辅助手段。决定性的牛顿力学从计算和预测的观点来看,实际上也具有内秉随机性,这就是微观层次上的混沌运动。大量隐藏在暗数据背后的某些看似简单原因所导致的复杂后果,则渐渐成为混沌研究的重要信息。混沌不是无序和混乱。与人们习以为常的周期排列或对称形状的数据相比,大自然和人类社会中的很多数据其实就是一种没有周期性次序的混沌。在理想模型中,它可能包含着无穷的内在层次,层次之间存在自相似性或不尽相似。在观察手段和技术的分辨率不高时,只能看到每一个层次或某一种类型的结构。但技术条件改变或提高后,在远离不能识别之处就会出现更小尺度上的结构。零维的点、一维的线、二维的面、三维的体和四维的时空,是人们现在所能认知的数据空间。如果在不远的将来,我们真的进入一个超数据时代,现有的技术和描述手段也许就无法对这种高度无序数据的混沌运动进行分形,而关于相变和临界现象理论的框架也需要一个新的重构。

这时我们不由得想到那个著名的洛伦兹“蝴蝶效应”理论,其实和这个理论相联系的还有一个被称为“湍流发生机制”的观点,认为向湍流的转变由少数自由度决定,经过两三次突变,运动就到了维数不高的奇怪吸引子上。这里所谓的吸引子是指运动轨迹长时间之后的终极形态,它可能是稳定的平衡点或周期性的轨道,也可能是继续不断变化、没有明显规则或次序的许多回转曲线。无论是蝴蝶效应还是湍流发生机制,其实都是对我们现在正在研究的激活数据学的一种理论上的关照和呼应。事实上,大数据乃至超数据时代的数据运动,就是这样一种处于混沌和分形之下的对数据运动轨迹及其规律的研究。许多看起来杂乱无章、随机起伏的数据变化或时空穿越,可能造成的就是类似亚马逊级别的数据风暴。如果说上述蝴蝶效应粉碎的是本就无法实现的长期天气预报的幻梦,那么紧接着的奇怪吸引子告诉我们的是,人类对于天气的实际预报能力并没有因那只蝴蝶的翅膀而受到任何影响,相反,却因对于更加混沌的数据的研究而提高了。激活数据学就是一种基于复杂理论及混沌研究的关于未来大数据乃至超数据时代的理论假说,就像上面讲的天气预报,但它所关心的并不是下个星期的晴雨冷热,而可能是未来10年耕种季节的平均降水量和平均气温。激活数据学研究使以往根据统计原则所做的预报上升为数据动力学的预报,也就是应用了似是随机现象的内在规律,从而提高了预测单个轨道近期行为的精确度,并丰富了长期预报的办法。

同样,我们还可以考察一个似静实动的模型。让沙子从一个漏斗孔中缓缓落到桌面上,形成渐渐变大的沙堆,总有最后新添加的某一粒沙子会在整个沙堆勉强维持平衡的锥面上导致一次“雪崩”,使一撮沙子滑到堆底,雪崩留下的小洼地会被后续的沙流填平,直到下一次更大的雪崩。在我们收集所有这些雪崩的数据后,可以发现它们的大小和间隔遵循某些数据动力规律,而沙堆模型无疑也启发了我们对于数据激活状态中的相变和突变的研究。无论数据的平衡态的相变或非平衡的临界多么不确定,可以确定的是,在搜索、融合、激活和碰撞等一系列状态下,数据在某一个临界点附近的扰动必然会导致某种全局性后果。当然,是否存在可以被“激活”的“数据蝴蝶”或“数据吸引子”,还需要我们进一步探寻,但这并不否定我们的所愿,而仅仅需要我们从实际数据的研究和挖掘中进一步加以发现。

作为一种理论假说,激活数据学就像一座朝向深邃的大数据宇宙的“天眼”。它是未来人类进入云脑时代的预报,是关于混沌的数据世界的跳出决定论和概率论的非此即彼、亦此亦彼的复杂理论的大数据思维范式的革命。从一定意义上来说,大数据就是面向未来社会人类需要破译的“基因”。正如因发明一种DNA(脱氧核糖核酸)快速测序方法而获得1980年诺贝尔化学奖的吉尔伯特针对生物学研究范式的变化指出的,“正在兴起的新的范式在于,所有的基因将被知晓,今后生物学研究项目的起点将是理论的。一位科学家将从理论的假设开始,然后才转向实验室去检验该假设”。是的,借助日渐深入的人工智能的发展,大数据的理论研究正在激发人类的新的假想和猜测。正是这种假想和猜测,让我们以某种“对称破缺”的方式去探知深邃未知的数据海洋,发现诸多社会发展法则背后产生影响甚至支配的物质和数字的力量。

人生是一种快变量,语言是一种慢变量,而数据将是一种突变量。虽然“未知”依然是现实的一部分,但是身处海量数据大爆发时代,人们坚信,未来已来!从“块数据1.0”到现在的“块数据4.0”,我们一直在持续探讨这个已来的未来,尤其是基于对“以人为原点的数据社会学的范式革命”的认知。事实上,从一开始.我们就没有把大数据仅仅看作所谓的“大”的数据,而是把大数据看作一种“活”的数据,因为只有激活,大数据才有生命,才有社会属性,才能成为未来世界人们赖以生存与发展的土壤和空气。最后,套用《爆裂》一书中关于现代世界生存的九大原则中“系统优于个体”的表述:真正具有竞争性的是一个系统,而非一个特别强大的个体;是一套能够保证不断成功的制度,而不是一个天才个人的行为。同样,激活数据学就是这样一个思想的系统,就是要为我们身处的这个大数据时代找到一个解决方案,这个方案可以构建一个融合数据、计算和场景的系统,让我们在大数据的时空中真正“思考和行动”起来。世界正处于根本结构性变革中,我们必须具备这样一种能力,即下意识地适应和发现因不适应我们的旧习惯而被忽视的事情。

连玉明

大数据战略重点实验室主任

2018年4月3日于北京

后记

块数据的研究已经进入4.0时代。回顾自2013年以来的整个研究历程,块数据已经从一个由大数据战略重点实验室提出的概念,成为近年来我国在大数据理论创新和实践创新方面的重要制高点;块数据已经从最初一个基于社会学研究的假设,成为被大数据技术专业领域所熟知并不断应用的重要理论;因为块数据,甚至催生了一场治理领域的“新风暴”——治理大数据与大数据治理,并使它的实现和兴起成为可能。今天,块数据4.0以人工智能时代的激活数据学为主题,深度研究激活数据学的运行机理以及应用场景,这不仅仅是研究的延续,更是一次全新的理论跃升。

“激活数据学”是时任贵州省委常委、贵阳市委书记陈刚同志在2015年12月1日会见微软亚洲研究院常务副院长马维英博士时提出的。2017年5月22日,陈刚同志又对“激活数据学”进行专题指导,提出了一系列重要观点,为《块数据4.0》的研究奠定了坚实的基础。激活数据学是以充分发挥人机群体智能为核心,综合运用数据科学、生命科学、社会科学、伦理学等提出的海量数据存储、处理和利用的解决方案。块数据就像是一个脑神经元,而激活数据学则是解决100亿个脑神经元怎样组成大脑的数据库构架系统,并将成为未来数据库构架系统的核心价值取向。激活数据学既是进行多维度大数据分析的方法论,也是基于复杂理论的大数据研究新范式。

“激活数据学”的提出,既是基于现实的,更是面向未来的。在小数据时代,数据越大,价值越大,而在大数据时代,数据越大,价值越小。数据迅猛膨胀将使“数据拥堵”现象日益普遍,并成为困扰人类的重要社会问题之一。面对海量数据的产生,我们如何发展人工智能,


资源链接
标签

经济图书世界及各国经济概况中国经济经济管理人工智能计算机与互联网经济建设与发展

发布日期

2019-02-18

擦亮日期

2019-02-18

扫一扫分享下载
资源网址导航
综合

361图书馆 图书酷 全索引

手机

电脑

影音

专业

游戏

体育

儿童

教育

资源分享站

其他