小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书全面而详细地讲述了关于数据仓库每一个重要部分的内容,包括计划、需求、体系、基础、结构、设计、数据准备、信息传递、配置和维护等。本书编排合理,每章提供本章主题,本章小结,可以使读者将每一个概念和技术同数据仓库的实践和市场结合起来;还提供复习思考题和练习供读者巩固学习到的知识。总之,本书几乎涵盖了数据仓库领域所有方面的知识,如果你想成为数据仓库领域专家,它是值得一读的。 本书是专门为IT专业人员而量身定做的介绍数据仓库知识的书籍,适合
《大数据时代的统计学思维:让你从众多数据中找到真相》是一本大数据时代下统计学思维和大数据分析的科普书籍,是一本了解大数据时代统计学思维和数据分析基本原理和方法的入门图书,是大数据时代每个人都需要了解的统计学基础理论、数据分析基本原理的入门图书。 《大数据时代的统计学思维:让你从众多数据中找到真相》结合30多个现实生活中的实例,介绍大数据时代下10多种常用的分析方法和基本原理,让你学会在众多数据中找到真相,而不被大量数据所欺骗,理论联系
这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。...
本书是国内绝大多数高校采用的知名教材《云计算》(1-3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合国内多位专家历时两年的心血之作。大数据领域一直缺乏一本权威教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法和工具和大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.c
本书内容分为三个部分,第一部分为互联网大数据的概述;第二部分为互联网大数据的获取与存储,包括了静态或动态WEB页面内容获取技术、结构化或非结构化数据的存储、常见的开源系统等;第二部分为处理与分析技术,包括了文本数据预处理、数据内容的语义分析技术、文本内容分类技术、聚类分析、大数据中的隐私保护、大数据可视化等内容;第三部分为综合应用...
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。
本书内容包括:绪论、准备知识、多阶段延缓纠正可靠性增长试验评估方法、多阶段含延缓纠正可靠性增长试验评估方法、多批次试验数据下装备命中概率评估方法、多来源试验数据下装备命中概率评估方法、航空子母炸弹制导精度鉴定的贝叶斯方法、预警雷达最大探测距离鉴定与评估的贝叶斯方法...
本书邀请了14位国内外大数据产学研有影响力的一线专家学者,总结各自的研究与工作专长,以专题的形式发表了各自的研究成果。本书主要包括了大数据综述、大数据思维、大数据技术与大数据应用四个部分。其中,大数据综述主要介绍大数据的概念、背景、技术与国内外政策等,让读者对大数据有个全景式的了解;大数据思维包括大数据的开放式创新与流动的大数据两方面;大数据技术分别介绍了大数据平台架构、大数据语义分析、情感分析、大数据可视化、多媒体搜索分析等当前的技
这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值...
本选题以科普的方式系统地阐述了大数据前沿技术与研究进展,对技术的来源、结论、对比、用途以及开源软件进行了深入浅出的描述,并不过多地涉及数学符号及基础原理。以大数据可视化为切入点,通过自然语言处理、社交网络挖掘、语义网络与知识图谱三方面非结构化数据处理技术,阐述大数据经典应用,利用基于图数据库、内存计算、分布式存储系统的大数据存储与管理作为大数据平台支撑,进而探讨基于众包技术扩充数据来源与提高数据质量,并围绕大数据环境下的隐私保护问题,
本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、唯一约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,
网店的运营有其自身的规律和特点,仅有好商品和低价格还远远不够,如果不懂得分析市场、不懂得选择款式、不懂得引流推广、不懂得数据分析、不懂得页面设计,纵然是经营经验丰富的实体店卖家,也会在触网后遭遇水土不服。本书正是为了系统解决网店运营方方面面的问题而编写的。书中几乎每一个小节都可以看成是网店运营的一个问题解决方案,几十个方案汇集在一起就成了一本网店运营宝典,为卖家的电商之路保驾护航。 此外,还赠送超值学习大礼包: 1. 网店管理与运营教
实用的python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本...
本书是《数据分析与数据挖掘》课程的实验指导书,结合大量实例全面阐述了使用SPSS系列软件进行数据分析与挖掘的原理、方法和步骤。全书分为两个部分,第一部分为数据分析实验,主要介绍如何利用SPSS Statistics软件进行统计分析,具体包括T检验、方差分析、相关分析等十三项实验科目,第二部分为数据挖掘实验,主要介绍如何利用Clementine(SPSS Modeler)软件进行数据挖掘,具体包括关联规则挖掘、决策数据分类、神经网络等五
大数据不仅意味着数据的积累、存储与管理,更意味着大数据的分析。数据挖掘无可争议地成为当今大数据分析的核心利器。R语言因彻底的开放性策略业已跻身数据挖掘工具之首列。本书以“R语言数据挖掘入门并不难”为开篇,总览了数据挖掘的理论和应用轮廓,明确了R语言入门的必备知识和学习路线,并展示了数据挖掘的初步成果,旨在使读者快速起步数据挖掘实践。后续围绕数据挖掘应用的四大核心方面,安排了数据预测篇:立足数据预测未知,数据分组篇:发现数据中的自然群组
本书以emba班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大
r是一种用于统计计算与做图的开源软件,同时也是一种编程语言,它广泛应用于企业和学术界的数据分析领域,正在成为最通用的语言之一。由于近几年数据挖掘、大数据等概念的走红,r也越来越多地被人关注。截至本文完成之日,cran(http://cran.r-project.org/)上共有4383个包,涉及统计、化学、经济、生物、医学、心理、社会学等各个学科。不同类型的公司,比如google、辉瑞、默克、美国银行、洲际酒店集团和壳牌公司都在
本书分为数据挖掘理论和数据挖掘实践两大部分。基础理论部分的主要内容包括数据挖掘的基本概念、数据挖掘的预处理、聚类分析、分类与回归、关联规则挖掘、例外点检测。数据挖掘实践部分讨论了数据挖掘在通信行业、文本挖掘等方面的实际应用;通过四个案例展示了在通信行业中如何利用数据挖掘进行客户细分、客户流失分析、客户社会关系挖掘、业务交叉销售;通过跨语言智能学术搜索系统和基于内容的垃圾邮件识别两个案例展示了数据挖掘在文本挖掘方面的应用。 本书可作为
本书是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。 本书内容涵盖R 数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R 包制作等内容。 本书的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习...
《视频大数据智慧计算方法》可作为大学和研究院所相关专业的教学用书和研究用书,同时还可以供政府部门和企事业单位参考...
本书分为两部分,共10章,从架构到管理,从自动化测试到持续集成,通过丰富的工作实例,系统而深入地讲解敏捷DW/BI的基本原理、关键技术和项目管理实践,为在真实商业智能和数据仓库项目上应用敏捷分析方法提供系统使用指南。从管理角度,详细介绍敏捷分析的基本原则,敏捷项目管理的有效实践,包括章程、规划、执行和检测敏捷分析项目的有效实践,展现如何使用案例和用户故事驱使价值持续传递,并讲解团队管理和领导的敏捷风格如何有效地替代传统命令控制风格;从
数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景不可估量。R 是一款极其优秀的统计分析和数据挖掘软件,本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的精髓并能快速、高效和灵活地掌握使用R 进行数据挖掘的技巧。 通过本书,读者不仅能掌握使用R 及相关的算法包来快速解决实际问题的方法,而且能得到从
本书讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。本书还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。 本书可作为技术研究人员,使用技术成果的分析
hadoop是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的hadoop(cdh5,apache hadoop 2.6)版本介绍hadoop技术的相关知识,不但详细介绍了hadoop、hdfs、yarn、mapreduce、hive、sqoop和hbase等,还深入探讨了hadoop、hbase的运维和性能调优,并包含了一个具有代表性的完整的基于hadoop的商业智能系统的设计和实现。 本书的大特点是
大数据为何如此聪明?它是否会chao越人类理性的控制?本书选取人机关系这一切入点作为分析视角,综合以往哲学界做出的相关论述,阐释了新的概念与理论体系下大数据如何在人机交互中构建和涌现智能。 本书以大数据时代作为总的分析背景,进行了“人机关系的内涵分析”“人机关系与心物关系问题的关联”“大数据的构建与其意向性的负载”“大数据的可建构性研究”“人机关系视域下的大数据的伦理问题”等方面的论述,在跟随时代热点的同时也对“心物关系”和“他心知
数据挖掘具有广阔的应用领域和发展前景。SPSS Modeler因界面友好且操作简捷,成为公认的数据挖掘实战的首选软件。基于多年的教学和科研经验,作者深知数据挖掘理论和软件操作相结合的重要性,努力在本书中突出以下特点:以数据挖掘过程为线索讲解Modeler软件操作。本书以数据挖掘实践过程为主线,从Modeler数据管理入手,说明问题由浅入深,讲解方法从易到难,旨在使读者在较短时间内掌握Modeler的基本功能和一般方法,并迅速运用到数据
数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过开源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考emc proven profess
大数据系列丛书由多本既独立又有丰富内在联系的大数据时代思维、技术与应用的教材组成。《大数据导论》是其中的一本,也是入门篇。 2012年以来,由于互联网和信息行业的快速发展,大数据越来越引起人们的关注,已经引发自云计算、互联网之后it行业的又一大颠覆性技术革命。人们用大数据来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。企业内部的经营信息、互联网世界中的商品物流信息,互联网世界中人与人的交互信息、位置信息等,数
本书是畅销书升级版,向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的成果,并以模块化的方式进行组织。本书着重介绍了机器学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值;同时,阐述了大数据给搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以及进行日志反馈学习
《企业级大数据平台构建:架构与实现》是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域工作超过20000小时的经验总结。作者朱凯从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,大家一定能找到灵感和思路来应对实际工作中面对的问题。本书在逻辑上分为三大部分:背景篇(靠前~2章):简单阐述了企业级大数据平台的重要性,并指出了作为一个企业
经过十余年信息化建设,很多企业都上线了各种业务系统,积累了大量业务数据,具备应用 BI (商业智能)进行数据分析和数据化管理的条件。而如何让BI项目在企业中落地并持续运转,成为很多企业尤其是传统企业头疼的问题。本书聚焦 BI(商业智能)与 BI 项目, 重点介绍 BI 项目的建设流程和运营技巧,并围绕 BI 项目中的场景和人员两大要素,分享了 BI 在零售、金融、 制造、 医疗和教育等行业中的应用案例, 提出了搭建企业数据人才培养体系
本书通过实践操作介绍大数据爬取、清洗与可视化的具体实施方案,共10章,包括大数据爬取、清洗与可视化概述,爬虫概述,Requests库,BeautifulSoup爬虫,自动化测试工具Selenium,中型爬虫框架Scrapy,数据存储,数据清洗,Matplotlib可视化,Pyecharts可视化。书中的案例均经过实践验证,可以帮助读者深入理解数据信息在大数据行业中的重要应用。为方便复习和自学,各章均配备丰富的习题。本书可作为高等院校大
编写本书的目的是使读者可以在最z短时间内掌握Excel 数据分析。本书以数据分析的整体流程和知识难易度来安排各章内容及其在全书中的次序,每一章内容都紧密围绕数据分析展开。全书共10 章,每天学习一章,10 天就能学会Excel 中的大多数数据分析工具的用法和技巧。本书的主要内容包括数据分析的基本概念和流程、Excel 中的数据分析工具的功能和特点、导入外部数据和输入不同类型的数据、修复有问题的数据、设置数据格式、排序、筛选、分类汇总、
《Hive数据仓库应用/大数据技术与应用丛书》从理论知识人手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。“工欲善其事,必先利其器”,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他
本书着重介绍了偏最小二乘、支持向量机、时间序列、数据包络法以及层次分析法的理论知识,并在此基础上分别进行了偏最小二乘通径模型在宁波与国内试点海绵城市水资源利用率比较、偏最小二乘通径模型的公共文化服务满意度测评与实证研究—以宁波市为例、偏最小二乘通径模型的新建本科院校学生自主学习能力实证研究、数据包络分析法的高校实验室投入产出效率评价及优化路径—以宁波大红鹰学院为例研究报告、支持向量机方法在宁波海洋生态环境安全预测研究、预测模型在宁波港
《数据准备和特征工程――数据工程师必知必会技能》详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。 《数据准备和特征工程――数据工程师必知必会技能》既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人
facebook、twitter和linkedin产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入nosql数据库;系统篇主要介绍了各种类型nosql数据库基本知识;应用篇对国内外知名公司在利用nosql数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及nosql
本书是站在数据挖掘的独特角度对神经网络、支持向量机和隐马尔可夫理论这三个重要的理论与方法进行重新剖析,并进行方法论基础上的应用,通过讲故事似的生动而系统地阐述数据挖掘的本质,来引领读者对数据挖掘的深入理解和应用...
本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。每个实验的内容包括实验目的、实验内容和要求、实验环境、实验报告。除此之外,实验一数据资源规划还包括了关于IRP2000工具的简介、学生学习生活情况的调查与分析、学生信息管理系统数据规划步骤等内容;实验二数据建模还包括了PowerDesigner工具的简介,学生学习生活
破除大数据神话 带领我们从云端回到地面 著名传播学者文森特莫斯可关于大数据的批判性力作...
本书从大数据发展现状出发, 在人类DIKW知识层次中认识“数据”, 阐述大数据时代以数据为中心的必然性, 进而提出数据管理的新范式, 即以系统科学及开放复杂巨系统为主要特征的范式, 并论述数据管理正在向新范式转换 ; 为解决数据系统中众多管理问题, 从数据语义出发给出数据分布模型概念, 并论述其是大数据时代数据管理的核心与基础 ; 定义了一种数据分布模型 —— MHM...
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中,Linux是学习大数据技术的基础,先从Linux入手,打下坚实的基础,之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。 大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作,为以后编程奠定坚实的基础。 Hadoop技术篇以Hadoop生态圈为中心,详细介绍Hadoop高可用集
本文主要包含七部分内容,分别为引言、时序数据约简建模与应用、新型距离测度模型与电力价格突变预测、云特征挖掘模型与电价预测、容差粗集模型与客户信用度分析、电力企业决策支持应用平台实例及结论与展望...
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本的问题, 包括什么是数据, 什么是大数据, 什么是数据挖掘, 以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用六章的篇幅, 介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘六种方法。第8章介绍一些实际的应用, 演示简单的数据挖掘方法如何产生巨大的价值...
本书结合数据科学与大数据技术专业 (本科) 和大数据技术与应用专业 (专科) 的教学需要以及大数据分析爱好者的自学需要, 从大数据和数据科学视角讲解Python编程的基础知识和基本技能, 内容包括: 数据科学实践和大数据分析中常用的知识点, 数据科学实践和大数据分析中常用的编程技巧等...
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。很后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品...
本书使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的不错技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面
作为《谁说菜鸟不会数据分析》家族的新成员,本书依然通俗地讲解数据分析的实践。《谁说菜鸟不会数据分析(SPSS篇)》继续采用职场三人行的方式来构建内容,细致梳理了准专业数据分析的常见问题,并且挑选出企业实践中容易碰到的案例,以轻松直白的方式来讲好数据分析的故事。从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且很好实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。尽可能避免使用晦涩难懂的统
刘争争
(美)艾玛·克莱因(EmmaCline
梁实秋
[英]蕾秋·乔伊斯 著,焦晓菊 译
汪曾祺
[日]熊田千佳慕著,张勇译
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071