小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
内容简介 这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门到进阶的突破。 全书一共11章,重点讲解了数据产品经理应该掌握的11个核心知识点,可以概括为四个部分。 第壹部分
本书十章内容分属上、中、下三篇。上篇为大数据关键技术篇,从数据、信息和知识内在的关联逻辑出发,技术结合实例,从技术体系的基本原理、核心技术的要素组成等方面,对大数据应用的基本原理和关键技术进行了系统的论述。并对大数据体系的技术生态环境进行了分析梳理。中篇为教育大数据应用创新篇,从支持“有效学习”的角度,利用知识图谱对教育大数据进行聚合分析,提出了支持现代教育技术创新的大数据应用方案和技术赋能路径。下篇为大数据应用拓展篇,重点从技术框架
人类是数据的创造者和使用者,中国已成为优选数据总量优选数据类型很丰富的的国家之一,大数据也将代表和催生一种全新的文明形式,中国,正以靠前的速度,硬来这个崭新的时...
《金融大数据》阐述了大数据技术在国内外金融领域的发展和应用现状,从大数据视角加以思考和探索,为金融创新、金融大数据研究和应用提供有益支持。 全书共15章。第1、2章介绍金融大数据的应用现状、资源和技术等。第3至14章是该书重点,分别介绍了大数据技术在证券期货、银行、保险和互联网金融中的应用。第3至5章为证券期货应用,典型应用包括自动化交易策略设计、金融期货风险监管、证券期货舆情分析等。第6至8章为银行业应用,典型应用包括银行客户
《数据挖掘算法与Clementine实践》主要介绍了几种最成熟的数据挖掘方法,并针对每种方法,,介绍了应用最广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、c5.o、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA
本书使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的不错技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面
内容简介这是一部以实战为导向,能指导读者零基础掌握Flink并快速完成进阶的著作,从功能、原理、实战和调优等4个维度循序渐进地讲解了如何利用Flink进行分布式流式应用开发。作者是该领域的专家,现就职于第四范式,曾就职于明略数据。全书一共10章,逻辑上可以分为三个部分:部分(~2章)主要介绍了Flink的核心概念、特性、应用场景、基本架构,开发环境的搭建和配置,以及源代码的编译。第二部分(第3~9章)详细讲解了Flink的编程范式,各
作为《谁说菜鸟不会数据分析》家族的新成员,本书依然通俗地讲解数据分析的实践。《谁说菜鸟不会数据分析(SPSS篇)》继续采用职场三人行的方式来构建内容,细致梳理了准专业数据分析的常见问题,并且挑选出企业实践中容易碰到的案例,以轻松直白的方式来讲好数据分析的故事。从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且很好实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。尽可能避免使用晦涩难懂的统
本书旨在探讨云计算在科学数据分析中不断演化发展的角色和地位变化,该项工作的重要性在于所有的科学领域都是数据驱动的。内容包括:公共云平台上LIGO物理应用的可扩展部署:工作流引擎与资源配置技术;面向大数据的FutureGrid测试平台;支持数据密集型应用的云网络;IaaS云测试案例:方法,挑战与经验;面向数据密集型应用的GPU加速云计算;面向数据密集型科研应用的适应性负荷分割与部署方法;DRAW:一种新的面向数据密集型应用的具有位置偏好
工欲善其事,必先利其器。数据分析也不例外,本书基于Excel,通俗地讲解数据分析全流程工具。作为《谁说菜鸟不会数据分析(入门篇)》的姊妹篇,本书继续采用职场三人行的方式来构建内容,细致梳理了数据分析工作的完整流程,并基于常用的办公软件Excel,精心挑选能够提高工作效率的常用工具来讲解。这些工具涵盖数据处理(Microsoft Access)、数据分析(Power Pivot、Excel数据分析工具库)、数据呈现(水晶易表)和报告自动
本书首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,又介绍了核心分析技术。内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现...
本书是一本从入门到精通模式的Selenium WebDriver实战经验分享书籍。全书共分为四个部分:部分为基础篇,主要讲解与自动化测试相关的基础理论、WebDriver环境安装、单元测试工具的使用方法及 WebDrvier的入门使用实例;第二部分为实战应用篇,基于丰富的实战案例讲解页面元素的定位方法及WebDriver的很常用API使用方法;第三部分为自动化测试框架搭建篇,深入讲解了页面对象的设计模式,以及分布式并发执行测试框架、数
本书由一线数据分析师精心编写,通过大量案例介绍了数据分析工作中常用的数据分析方法与工具。本书包括5章内容,分别是数据分析入门、数据分析——从玩转Excel开始、海量数据管理——拿MySQL说事儿、数据可视化——Tableau的使用、数据分析进阶——Python数据分析。本书通俗易懂、通过大量贴近企业真实场景的案例,帮助读者在提高数据处理技能的同时加深对数据分析思维的理解。本书适合有志于从事数据分析工作或已从事初级数据分析工作的人士自学
内容简介:本书共有8章,面向的对象是Excel初学者,从Excel的基本理念开始,用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化,这是极其重要的,任何一个Excel小白都不能跨过这一步!即使已经有了所谓Excel基础的人,很后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍,以及如何利用这些工具技能来解决实际问题...
Alluxio 这一以内存为中心的分布式虚拟文件系统,很初诞生于加州大学伯克利分校的 AMPLab,其开源社区在目前大数据生态系统中发展很快。本书以广泛使用的 Alluxio 1.8.1 版本为基础进行编写,是一本全面介绍 Alluxio 相关技术原理与实践案例的书籍。本书主要内容包括 Alluxio 系统快速入门、Alluxio 系统架构及读写工作机制、Alluxio 与底层存储系统的集成、Alluxio 与上层计算框架的集成、Al
本书面向数学与工程计算,主要讲解了MATLAB 2017a软件基础、初等数学专题概要、高等数学基本问题、线性代数与矩阵论基本问题、概率论与数理统计基本问题、数值分析基本问题、CASIO fx—991CN X(中文版)函数科学计算器简介七方面的内容。本书适合大中专院校理工科学生学习使用,也可供广大科研人员、学者、工程技术人员及MATLAB专业人员参考...
本书内容包括:读本概览;深入研究之前;项目/程序规划;需求定义;数据架构;维度建模基础;维度建模任务和职责;事实表核心概念;维度表核心概念;更多的维度模式和注意事项;后台ETL和数据质量;技术架构注意事项;前台商业智能应用程序;维护和发展的注意事项等...
本书一共分为3篇:基础篇、案例篇和工具篇。“基础篇”从理论基础和基本原理层面介绍了MySQL的安装与配置、升级和体系结构,information_schema、sys_schema、performance_schema和mysql_schema,MySQL复制,MySQL事务,SQL语句优化及架构设计基础知识。“案例篇”从硬件和系统、MySQL架构等方面给出了性能优化的十几个案例,包括:性能测试的基本优化思路和很需要关注的性能指标解释
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的
本书系统介绍大数据技术的原理、数据挖掘与应用, 主要内容包括基本概念、数据收集、数据存储、数据处理、大数据可视化、信息检索、数据挖掘和效能评估。本书以简单易懂的语言、生动有趣的实例和图形展示知识点, 将概念、原理与应用融会贯通, 并对大数据工具软件进行了细致的梳理...
本书同其他数据分析方面的专著相比特点鲜明:首先,作者专注于问卷来源的数据分析,对数据分析方法的介绍更加专注、详细和深入;其次,作者没有讲解任何数据分析背后的数学原理,着重介绍的是数据分析方法的实际应用;*后,本书内容深入浅出,适合所有对问卷数据分析有需求的读者随时翻看查阅。...
本书全面阐述了全球最新的安全理论与安全架构体系, 并结合作者自身经验层层剖析了包括Google在内的各大互联网企业所应用的各种关键安全技术的原理以及具体实现。全书共分为3篇15章。上篇“安全理论体系”主要讲解了业界先进的安全架构体系 (IPDRR模型、集成式自适应网络防御、网络韧性架构) 与安全建设理念 (ISMS管理体系、BSIMM工程体系、Google技术体系) 。中篇“基础安全运营平台”主要内容有: 威胁情报、漏洞检测、入侵感知
本文主要包含七部分内容,分别为引言、时序数据约简建模与应用、新型距离测度模型与电力价格突变预测、云特征挖掘模型与电价预测、容差粗集模型与客户信用度分析、电力企业决策支持应用平台实例及结论与展望...
《谁说菜鸟不会数据分析》(入门篇)是一本有趣的数据分析书!本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,接近按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、数据分析的结构化思维、数据处理技巧、数据展现的技术、提升图表之美的专业化视角,以及专业分析报告的撰写方法等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场
《数据链技术及应用》是一本全面介绍数据链系统概念、原理、组成、功能、集成及作战应用的教科书。全书共分7章,围绕数据链系统这一核心概念,主要介绍了数据链系统的基本概念、组成及工作原理,详细阐述了数据链系统的信息传输、信息安全、网络管理以及数据链与平台的集成,很后介绍了数据链在作战中的应用。《数据链技术及应用》可作为军队院校通信工程和指挥信息系统工程等相关专业的本科生教材,也可作为地方高等院校国防生相关专业教材和各类军队干部培训(轮训)教
本书从实战出发,介绍微服务架构所带来的测试方面的挑战,以及如何利用新的技术来应对这些挑战。通过本书,读者可以学会如何编写微服务架构下的单元测试、组件测试、集成测试以及契约测试。在此过程中还会用到Arquillian、ShrinkWrap、Pact、Selenium、Docker、Hoverfly 等多个帮助测试的工具和框架。书中涵盖大量的代码和样例,可以帮助读者快速上手,并在自己的实际工作中应用这些技术。本书适合有一定Java 基础的
社交网站数据如同深埋地下的“金矿”,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?《挖掘社交网络(影印版 第3版 英文版)》第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、GitHub、邮件、网站和博客等)的数据,以及如何通过可视化找到你一直在社交世界
零基础入门,让读者轻松、快速地掌握使用Power BI 创建和设计报表的整体流程。本书为读者提供了一个轻松愉快的阅读学习体验,全彩印刷、版式灵活、颜色清爽、内容优选、案例典型、视频赠送。本书包含大量案例,读者可以边学边练,书中的大多数3 级标题以案例名称命名,既便于读者从目录中快速找到相应的案例,又能让读者了解每个知识点、每项技术的实际应用场景,从而实现技术与应用的无缝对接。为了便于读者学习和练习,本书附赠所有案例的源文件和重点案例的
本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、
《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》源自网易公司多位资深数据库专家数年的经验总结和MySQL数据库的使用心得,在之前版本的基础之上,基于MySQL 5.7版本进行了内容升级,同时也对MySQL 8.0的重要功能进行了介绍。除了对原有内容的更新之外,本书还新增了作者在高可用架构、数据库自动化运维,以及数据库中间件方面的实践和积累。 《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》分为“基础篇”“开发篇
本书共有8章, 面向的对象是Excel初学者, 从Excel的基本理念开始, 用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化, 这是极其重要的, 任何一个Excel小白都不能跨过这一步! 即使已经有了所谓Excel基础的人, 最后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍, 以及如何利用这些工具技能来解决实际问题...
《Python数据分析与大数据处理从入门到精通》主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。本书轻理论、重实践,目的是让读者快速上手。1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等,掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信,让读者对分布式程序有个基本
《谈谈大数据的那点事》是一本关于大数据的妙趣横生的科普读物。全书分三部分:一部分介绍大数据时代、大数据的内涵、大数据认知的误区,以及大数据的安全性;第二部分介绍一些有趣的案例,大数据与我们生活的关联、大数据带来意想不到的结果、大数据研究与应用的新领域,以及引发的反思;第三部分介绍推动大数据发展的动力、大数据产业发展的一些思考、大数据人才培养与团队建设,以及人工智能与统计学的关系等。 为了让读者更全面、准确而轻松地了解大数据,本书
本书从整体上进行了改编、扩展和提升。主题内容也有所延伸,其中包括数据的类型与域、表的比较、映像关系、聚集操作符与汇总、视图更新以及子查询。还特别收录了一个新附录——NoSQL与关系理论。本书涵盖以下内容:是否可以编写SQL查询找到在公司每个编程部门都至少工作过一次的员工?你是否可以确保查询的正确性?为什么恰当的列命名很好重要?数据库中的null会带来错误的答案。为什么?你又能做什么?映像关系如何能帮助你表述复杂的SQL查询?虽然SQL
本书从教育大数据的重要意义、国内外教育大数据的研究现状以及政策支持出发, 对教育大数据的相关概念和内涵做阐述说明, 介绍了教育大数据的技术、技术标准、治理与开放、风险管理与法律政策, 重点阐述了教育大数据在教育领域的典型应用, 包括教育大数据在课堂教育、校园管理、在线教育、开放远程教育、教育培训行业以及学生综合素质评价等方面的应用, 最后提出教育大数据的发展趋势和机遇挑战...
《大数据技术和应用/大数据人才培养丛书》是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和错误之处。 全书分为9章,全面介绍了大数据技术的相关基础知识、HDFS和数据库、采集传输工具、挖掘分析算法、Spark计算框架、可视化、大数据安全、大数据应用等内容,着重介绍了HDFS分布式文
本书梳理了内容产业的变化,提出将内容产业与大数据及深度学习等优选技术结合的切入点——内容评估体系,并结合数学模型提出算法,从数据采集、存储、处理几个方面展示全流程的实操与验证。书中所阐释的观点与实践经验为内容产业工作者和研究者提供了示范和启发,适合相关从业人员和本科高年届和研究生阅读...
本书名《数典》,定义为大数据标准术语体系,是迄今为止优选首部全面系统研究大数据标准术语的多语种专业工具书。该书以优选语境和未来视角,对大数据知识体系进行了全面梳理,提出了九个方面的术语架构,并以十一种语言对照编纂,形成了统一规范、符合靠前通用规则的多语种学术话语体系和术语标准体系...
本书从解决工作实际问题出发,提炼并总结工作中R 语言常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习和理解的前提下,尽可能地避免使用晦涩难懂的R 语言编程、统计术语或模型公式。如果读者需要了解相关的知识,可查阅相关的图书或资料。本书的定位是带领R 语言数据分析初学者入门,并解决在学习、工作中使用R 语言进行数据分析的大部分问题或需求。如果读者在入门后还需要进一步学习,可自行扩展阅读相关图书或资料,因
现代信息社会已经迈入大数据时代,但大数据给人们带来了的挑战,如何有效地从动态变化,结构化、半结构化和非结构化等多模态数据共存的大数据中进行高效实时的数据挖掘并发现有价值知识已成为当前信息科学领域亟待解决的问题。《大数据挖掘的原理与方法——基于粒计算与粗糙集的视角》针对大数据呈现的体量巨大、多源异构、动态性和不确定性等特点,以粒计算理论为基础,以典型粗糙集模型为对象,以增量学习技术为手段,以云计算并行框架为支撑平台,构建大数据分析与挖掘
《数据库设计与开发》是在作者2006年出版的《数据库原理与应用》教材基础上编写而成,选用新的数据库管理系统SQL Server 2012和系统开发平台Visual Studio 2012,以“网上选课系统”案例贯穿《数据库设计与开发》,全面介绍了数据库系统、数据库设计、数据库管理、数据库应用系统开发以及数据库教学设计等方面的基本原理、项目开发过程和教学案例。 《数据库设计与开发》共8章,内容包括数据库系统概述、数据库设计、关系数
在大数据时代下,互联网平台产生的大规模海量搜索数据的价值不断得到学术界和工业界的重视。然而,现有的互联网海量搜索数据的研究中缺乏系统的分析和讨论,并没有建立一套针对其数据特征的分析框架。针对目前互联网海量搜索数据在预测和预警研究方面的不足,本书提出了一个基于互联网海量搜索数据的预测及预警分析框架,以互联网搜索数据为基础,通过网络文本挖掘、特征选择等确定关键词,将计量经济模型、人工智能技术等综合集成起来,提出了关键模型、方法和技术,并将
Python 是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI 技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python 来做预测,不仅能够在业务上快速落地,还让代码维护更
本书介绍Spark应用开发的面向对象和函数式编程概念,讨论RDD和DataFrame基本抽象,讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序,很后介绍监控、配置、调试、测试和开发等不错主题。通过本书的学习,你将能使用SparkR和PySpark API开发Spark应用程序,使用Zeppelin进行交互式数据分析,使用Alluxio进行内存数据处理,将透彻理解Spark,并能对海量数据执行全栈
近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。部分 大数据处理框架的基础知识(~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分 S
大数据思维变革、大数据概念、大数据与云计算和物联网及人工智能、大数据采集、大数据存储、大数据分析、大数据可视化、大数据安全、大数伦理、大数据应用。本书可作为大学生的大数据通识教材,也可作为IT人员、企业策划和管理人员、培训中心的参考书...
“十三五”以来,中石油、中石化、万华化学、华谊化工、国家电网、宝武钢铁等靠前流程行业领头者开展了数字化、智能化建设,加快数字化油田、智能炼厂、智慧电网、智慧炼钢等建设。信息化与自动化互相交织融合,积累了大量的工业数据,给以油田开发、石油石化、化工、钢铁、电力为代表的流程工业带来了新的挑战与机遇,也为其创新带来了新的技术能力。本书以大数据治理、大数据分析为主线,以油气开发、石油石化、化工、钢铁、电力为代表的流程工业大数据创新为分支,详细
《数据治理:工业企业数字化转型之道》是一本全面关注工业企业数据治理方面的工具书,主要内容分为概述篇、体系篇、工具篇、实施篇及案例篇。其中概述篇主要介绍工业企业数据治理的基础概念、主流数据治理标准及框架、数据治理的发展趋势等;体系篇主要介绍数据管控、数据战略、数据架构、主数据管理等的基本原理与管理体系;工具篇主要介绍主数据管理工具、数据模型管理工具、数据资产运营工具等;实施篇主要介绍具体实施策略及路径选择、顶层架构规划与设计、数据资产运
当今世界,科技进步日新月异,互联网、大数据、云计算等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。大数据是工业社会的“自由”资源,谁掌握了数据,谁就掌握了主动权。本书通过介绍45家靠前知名公司在利用大数据方面的成功经验,为企业、政府和其他单位利用大数据进行有效决策,推动技术革新和更有效谋划企业战略定位及发展提供很好有价值的参考,以大数据信息流带动技术流、资金流、人才流、物资流融合发展...
本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。本书从逻辑上可以分为三部分:部分是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、
本书通过对多个实例的演示与讲解,详细介绍了Excel的新功能组件Power Query在数据查询与数据转换方面的主要功能。全书共分为8章,主要包括Power Query编辑器的基本功能,常见数据类型的查询与导入,对原始数据进行合并、拆分、计算、转换等数据整理操作,Power Query中M公式的编写方法等。 本书语言风趣,专注于具体的应用场景,而不拘泥于功能本身,图示清晰、可操作性强且便于查阅,能有效帮助读者提高Excel的使用水平
[日]熊田千佳慕著,张勇译
吴晗 著
[英]蕾秋·乔伊斯 著,焦晓菊 译
林奕含
梁实秋
(美)艾玛·克莱因(EmmaCline
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071