小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书是一部关于现代数据库系统的基本原理与技术的教科书,本书突出了数据库和新技术的应用及教学的需要。在编写注重原理与技能的并重,传统与内容先进性实用内容并重以及课堂教学与实验并重,学生学后能掌握数据库的基本原理,熟练掌握一个数据库产品的操作并学会开发、设计与管理数据库的能力。 本书由16章构成,内容包括基本原理、基本操作、数据库设计及应用等,突出Web数据库交换等内容。本书各章均配有丰富的习题以及复习提纲,同时本书还附有实习指南供数据
当下,由于强大的数据挖掘软件平台很容易获得,草率地使用数据挖掘方法和技术将导致挖掘的结果混淆难解。这种失误往往源自盲目使用“黑盒子”方法进行数据挖掘,而最好的避免途径就是使用“自盒子”方法,理解隐藏在软件背后的算法和统计模型结构。 本书分为7章,第l章是对降维方法的介绍,这是数据挖掘技术的一个先决条件;第2章至第6章为经典的数据挖掘算法和技术,包括一元回归模型、多元回归模型、逻辑回归模型、贝叶斯网络分析以及遗传算法,通过实
空间数据挖掘是一个从海量数据中概括知识的不确定过程,不同用户在不同条件下有着不同的挖掘要求。本书提出空间数据挖掘视角,描述不同的数据挖掘需求,实现从相同数据向多种知识的变粒度挖掘。空间数据挖掘不确定性的内因和外因,决定了在空间数据挖掘视角中管控不确定性的技术。云模型集成模糊性和随机性,数据场刻画数据的自然拓扑关系,能够实现定性定量的相互转换。滑坡监测数据挖掘视角和网络化数据挖掘视角表明,空间数据挖掘视角发现的多粒度知识可以满足不同用户
《大数据测评》一书介绍了大数据的概念和特征,各国大数据发展的战略、发展趋势及其标准化情况,以及对于软件测试带来的挑战。在此基础上,《大数据测评》在面向大数据处理框架、大数据基础算法、应用系统、系统安全和隐私泄露的测评技术等方面展开了分析和讨论。以Hadoop为主线开展大数据测试的探讨。在底层支撑框架层聚焦于单元测试和框架基准测试;在基本算法中涵盖了聚类、分类及其个性化推荐;在应用层,介绍了其性能测试中若干问题,重点阐述数据集的设计与分
《城市发展的数据逻辑》系统、全面地介绍了与城市发展有关的各种空间数据。在此基础上介绍了国内外对城市生产的研究现状,总结了目前国内外城市大数据研究的形成和发展、城市生长模型及其新方法,并借助一些典型案例,介绍应用城市生长技术的流程与方法。《城市发展的数据逻辑》还介绍了GIS、RS、GPS等新技术在城市发展及城市规划中的应用,以及如何使用新的信息技术方法揭示城市发展过程中诸如道路交通、城市建筑、公共设施等城市因子与城市发展的内生联系...
本书系统地讨论了大量设计议题、并包括21个设计建议、8个实践建议、7个设计原则、27个通用算法和技术、12个元数据驱动的通用操作符、7个工作过程、4个范式基础及范式原则。内容包括: 绪论、体系结构概要、预备域等...
这是一个“数据为王”的时代,数据驱动“工业4.0”、“互联网+”、“中国制造2025”滚滚前行;数据是企业沉睡的资产,是生生不息的宝藏;只有去认识、去发掘,大数据才能体现巨大的业务价值...
本书讲述MySQL数据库的开发技术。全书共分为16章,内容包括MySQL发展历史,与其他数据库的区别,MySQL常用的一些工具,MySQL文件结构、系统架构、存储引擎、数据类型,数据库和表的创建、管理和删除,数据完整性约束,包括主键约束、外键约束、非空约束、默认值约束、唯一约束和自增约束等,数据的单表查询和多表查询,视图和索引,变量、常量、运算符和表达式、运算符的优先级、流程控制语句、自定义函数,系统函数,存储过程和触发器,事务管理,
《经济学人》年度推荐三大可视化图书之一 《大数据时代》作者、《经济学人》大数据主编肯尼思库克耶倾情推荐,称赞其为“关于数据呈现的思考和方式的颠覆之作” 亚马逊数据和信息可视化top3图书 ...
数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景不可估量。R 是一款极其优秀的统计分析和数据挖掘软件,本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的精髓并能快速、高效和灵活地掌握使用R 进行数据挖掘的技巧。 通过本书,读者不仅能掌握使用R 及相关的算法包来快速解决实际问题的方法,而且能得到从
《视频大数据智慧计算方法》可作为大学和研究院所相关专业的教学用书和研究用书,同时还可以供政府部门和企事业单位参考...
本书源自作者在斯坦福大学教授的“海量数据挖掘”(cs246: mining massive datasets)课程,第1版上市以来受到读者广泛欢迎和认可。这个新版本在上一版基础上新增三章内容,分别涵盖社会网络图挖掘、降维和大规模机器学习,同时也更新了第1版的部分内容。 众所周知,移动互联网、社交媒体、电子商务和各种传感器的运用产生了超大数据集,挖掘这些数据可以提炼出有用的信息。本书以大数据环境下的数据挖掘和机器学习为重点,全面介绍
实用的python开源模块的大集合; 简单易懂、示例丰富的数据分析教程; 掌握数据可视化、机器学习等高端主题; 新手变身数据分析专家的上好读本...
《大数据挖掘》一书立足前沿性、注重实用性,着眼于大数据发展的最新研究热点和动向,系统介绍了大数据挖掘的概念、原理、技术和应用,全面而细致地定义和归纳了关联分析、聚类分析、分类分析、异常分析、特异群组挖掘和演变分析等大数据挖掘任务。 本书由上海市数据科学重点实验室朱扬勇教授团队主持著述,该实验室是国内首个致力于数据科学理论、方法和技术研究的机构,专注于金融、智能交通、医疗健康、智慧城市等多领域的大数据分析应用...
2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录! 交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。 成功创下这项纪录背后,有odps很大的功劳! 阿里巴巴集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台odps完成,odps为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提
适读人群 :想全面学习wireshark的初学者、网络管理员、渗透测试人员、网络安全专家、网络数据分析人士 通过80个实例,详细讲解了wireshark数据包分析实施的8大类技巧 基于wireshark抓取的数据包,层层剥茧地剖析了12种常见网络协议的构成 全面涵盖wireshark基础知识和应用技巧,以及使用wireshark对网络协议进行分析 遵循规范,从专业的角度循序渐进地讲解了wireshark抓包及分析的实施流程 针对海量数
以商业数据分析为主线,立足互联网工作现实。从如何获取数据到如何在实际工作场景中分析数据,*后以如何完美呈现数据分析的结果为结尾。帮助读者从零进阶,玩转商业数据分析...
数据科学和大数据分析是指利用数据的力量来发现新的见解。本书涵盖了数据科学涉及的行为广度以及所使用的方法和工具。本书内容侧重于任何行业和技术环境中都会用到的概念、原理和实际应用,并通过开源软件来分析案例,以帮助读者更好地理解。本书将帮助您:成为数据科学团队中的一名贡献者;部署结构化的生命周期方法来分析数据问题;应用合适的分析技术和工具来分析大数据;学习如何用数据来讲一个动人的故事,以推动商业行为;备考emc proven profess
本书讲述如何从技术和市场信息特别是专利信息中挖掘获得潜在的竞争情报,从介绍技术挖掘的基础概念、原理开始,讲解数据采集、基本分析、高级分析、趋势分析、专利分析的方法和技巧,给出技术挖掘指标组合,并结合具体案例指出技术挖掘过程中的注意事项,帮助读者了解技术挖掘流程和掌握技术挖掘方法。本书还列出了可供选择使用的科技数据库、技术挖掘软件的资源清单,为有意实际进行技术挖掘的读者提供了指引。 本书可作为技术研究人员,使用技术成果的分析
本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。每个实验的内容包括实验目的、实验内容和要求、实验环境、实验报告。除此之外,实验一数据资源规划还包括了关于IRP2000工具的简介、学生学习生活情况的调查与分析、学生信息管理系统数据规划步骤等内容;实验二数据建模还包括了PowerDesigner工具的简介,学生学习生活
hadoop是目前受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书基于新的hadoop(cdh5,apache hadoop 2.6)版本介绍hadoop技术的相关知识,不但详细介绍了hadoop、hdfs、yarn、mapreduce、hive、sqoop和hbase等,还深入探讨了hadoop、hbase的运维和性能调优,并包含了一个具有代表性的完整的基于hadoop的商业智能系统的设计和实现。 本书的大特点是
本书邀请了14位国内外大数据产学研有影响力的一线专家学者,总结各自的研究与工作专长,以专题的形式发表了各自的研究成果。本书主要包括了大数据综述、大数据思维、大数据技术与大数据应用四个部分。其中,大数据综述主要介绍大数据的概念、背景、技术与国内外政策等,让读者对大数据有个全景式的了解;大数据思维包括大数据的开放式创新与流动的大数据两方面;大数据技术分别介绍了大数据平台架构、大数据语义分析、情感分析、大数据可视化、多媒体搜索分析等当前的技
本书是国内绝大多数高校采用的知名教材《云计算》(1-3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合国内多位专家历时两年的心血之作。大数据领域一直缺乏一本权威教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法和工具和大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.c
本书以emba班的“数据挖掘技术及其应用”教学为场景,带领读者步入数据挖掘的神秘殿堂,领略数据挖掘的神奇魅力。全书分为9章:第1章从三个真实故事开始数据挖掘之旅;第2章以某企业生产中遇到的质量控制难题的解决过程为线索,展现数据挖掘的实施过程;第3章到第9章以典型案例的形式分别介绍了数据挖掘技术在电力行业、交通航空领域、冶金行业、税务与金融行业、电信行业、故障诊断以及互联网行业的应用。 数据挖掘是一种专业性极强的技术,本书避开大
r是一种用于统计计算与做图的开源软件,同时也是一种编程语言,它广泛应用于企业和学术界的数据分析领域,正在成为最通用的语言之一。由于近几年数据挖掘、大数据等概念的走红,r也越来越多地被人关注。截至本文完成之日,cran(http://cran.r-project.org/)上共有4383个包,涉及统计、化学、经济、生物、医学、心理、社会学等各个学科。不同类型的公司,比如google、辉瑞、默克、美国银行、洲际酒店集团和壳牌公司都在
本书提供了大数据和分析技术应用于石油和天然气行业的完整视图。这本书包含多个实例研究, 强调了在石油和天然气勘探和生产阶段对优化的迫切需求, 并展示了数据分析如何提供这种优化, 涉及石油和天然气的勘探、开发、生产和油气资产的复兴, 可有效地推动石油和天然气的勘探和生产...
本书分为两部分,共10章,从架构到管理,从自动化测试到持续集成,通过丰富的工作实例,系统而深入地讲解敏捷DW/BI的基本原理、关键技术和项目管理实践,为在真实商业智能和数据仓库项目上应用敏捷分析方法提供系统使用指南。从管理角度,详细介绍敏捷分析的基本原则,敏捷项目管理的有效实践,包括章程、规划、执行和检测敏捷分析项目的有效实践,展现如何使用案例和用户故事驱使价值持续传递,并讲解团队管理和领导的敏捷风格如何有效地替代传统命令控制风格;从
大数据为何如此聪明?它是否会chao越人类理性的控制?本书选取人机关系这一切入点作为分析视角,综合以往哲学界做出的相关论述,阐释了新的概念与理论体系下大数据如何在人机交互中构建和涌现智能。 本书以大数据时代作为总的分析背景,进行了“人机关系的内涵分析”“人机关系与心物关系问题的关联”“大数据的构建与其意向性的负载”“大数据的可建构性研究”“人机关系视域下的大数据的伦理问题”等方面的论述,在跟随时代热点的同时也对“心物关系”和“他心知
本书重点介绍了基础设施运维概念以及如何进行规范操作,实用性高,可操作性强。主要内容如下。第1章总则部分,定义了规程中用到的术语、编写原则、适用范围。第2章对数据中心运维组织、人员、基本制度、运维流程进行了描述。第3~9章重点描述了高低压变配电系统、发电机组、UPS、直流系统、蓄电池组、冷水型制冷系统、直接膨胀式空调、新风自然冷系统、普通空调、制冷自控系统BA、动力环境监控系统、防雷接地系统、综合布线、安防系统和消防系统的维护技术和维护
本书抽丝剥茧地讲述了云计算简史、大数据的前世今生,纠正了一些时下被误导的观点,分析了大数据与Hadoop的关系、云计算与大数据的关系,从开源vs.闭源的角度阐释了整个业界的软件定义趋势、商用硬件趋势并预言了硬件回归的必然趋势,然后用案例讲解了云计算或大数据系统体系架构的设计与实现。...
本书是50个优秀案例的汇编,充分展示了部分先行先试的国内企业在大数据技术、产品、服务以及应用方面的经验和模式,以及取得的初步成效。编者希望通过这种展示方式,为相关地区、行业、企业发展和应用大数据提供有益的借鉴与思考,同时促进政产学研用深度合作,指导和帮助地方、企业和用户加强沟通交流。...
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
本文主要包含七部分内容,分别为引言、时序数据约简建模与应用、新型距离测度模型与电力价格突变预测、云特征挖掘模型与电价预测、容差粗集模型与客户信用度分析、电力企业决策支持应用平台实例及结论与展望...
《大数据时代的统计学思维:让你从众多数据中找到真相》是一本大数据时代下统计学思维和大数据分析的科普书籍,是一本了解大数据时代统计学思维和数据分析基本原理和方法的入门图书,是大数据时代每个人都需要了解的统计学基础理论、数据分析基本原理的入门图书。 《大数据时代的统计学思维:让你从众多数据中找到真相》结合30多个现实生活中的实例,介绍大数据时代下10多种常用的分析方法和基本原理,让你学会在众多数据中找到真相,而不被大量数据所欺骗,理论联系
“大数据”近年成为IT领域的热点话题,人们每天都会通过互联网、移动设备等产生大量数据。如何管理大数据、掌握大数据的核心技术、理解大数据相关的生态系统等,是作为大数据开发者必须学习和熟练掌握的。本系列书以“大数据开发者”应掌握的技术为主线,共分两卷,以7个模块分别介绍如何管理大数据生态系统、如何存储和处理数据、如何利用Hadoop工具、如何利用NoSQL与Hadoop协同工作,以及如何利用Hadoop商业发行版和管理工具。本系列书涵盖了
《企业级大数据平台构建:架构与实现》是一部教你如何从0到1架构与实现一个企业级大数据平台的著作,是作者在大数据和系统架构领域工作超过20000小时的经验总结。作者朱凯从横向视角出发,手把手教你如何拉通Hadoop体系技术栈,以此搭建一个真实可用、安全可靠的大数据平台。通过阅读本书,大家一定能找到灵感和思路来应对实际工作中面对的问题。本书在逻辑上分为三大部分:背景篇(靠前~2章):简单阐述了企业级大数据平台的重要性,并指出了作为一个企业
本书内容详实而富有实际指导价值, 通过本书, 软件开发者和架构师将学到如何将这些原则用于实践, 如何在最新应用架构中充分发挥数据的威力。内容包括: 数据系统基础 ; 分布式数据系统 ; 派生数据...
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。很后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品...
本书是一本从入门到精通模式的Selenium WebDriver实战经验分享书籍。全书共分为四个部分:部分为基础篇,主要讲解与自动化测试相关的基础理论、WebDriver环境安装、单元测试工具的使用方法及 WebDrvier的入门使用实例;第二部分为实战应用篇,基于丰富的实战案例讲解页面元素的定位方法及WebDriver的很常用API使用方法;第三部分为自动化测试框架搭建篇,深入讲解了页面对象的设计模式,以及分布式并发执行测试框架、数
本书从实战出发,介绍微服务架构所带来的测试方面的挑战,以及如何利用新的技术来应对这些挑战。通过本书,读者可以学会如何编写微服务架构下的单元测试、组件测试、集成测试以及契约测试。在此过程中还会用到Arquillian、ShrinkWrap、Pact、Selenium、Docker、Hoverfly 等多个帮助测试的工具和框架。书中涵盖大量的代码和样例,可以帮助读者快速上手,并在自己的实际工作中应用这些技术。本书适合有一定Java 基础的
内容简介:本书共有8章,面向的对象是Excel初学者,从Excel的基本理念开始,用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化,这是极其重要的,任何一个Excel小白都不能跨过这一步!即使已经有了所谓Excel基础的人,很后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍,以及如何利用这些工具技能来解决实际问题...
本书主要介绍大数据可视化的基本概念和相应的技术应用。全书内容共10章,分别为大数据可视化概述、大数据可视化原理、大数据可视化方法、数据可视化工具、Excel数据可视化、Tableau数据可视化、ECharts与pyecharts数据可视化、Python数据可视化、大数据可视化行业分析以及大数据可视化综合实训。 本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析的相关技术,并且对于书中重要的、核心的知识点加大练
本书共13章,主要内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用Hive进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、H
本书结合理论和实践,由浅入深,全方位介绍了Hadoop 这一高性能的海量数据处理和分析平台。全书5部分24 章,第Ⅰ部分介绍Hadoop 基础知识,第Ⅱ部分介绍MapReduce,第Ⅲ部分介绍Hadoop 的运维,第Ⅳ部分介绍Hadoop 相关开源项目,第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapR
本书基于作者近几年来的研究开发成果及应用实践,对物联网大数据技术体系进行了系统归纳,阐述了物联网环境下感知数据的特性、数据模型、事务模型以及调度处理方法等核心概念及关键技术,并对物联网大数据存储、管理、计算与分析的基本概念和关键技术进行了剖析。本书还介绍了自行研发的面向物联网的ChinDB实时感知数据库系统以及针对云计算环境下物联网大数据管理与应用的DeCloud云平台,介绍了它们在智能交通、智能电厂、教育、安全监控等多个行业的应用。
本书主要面向商业领域的读者,并基于以下几个关键前提:● 组织机构不需要大数据策略。相比之下,他们需要整合了大数据的商业策略。● 商业领袖将分析方法转化为信息技术的时代已经结束,未来的企业领导者必须将分析方法视为与会计、财务、管理科学和营销一样的商业规则。● 数据货币化和商业转型的关键在于释放机构的创造性思维,必须让企业用户能够像数据科学家一样思考。● *后,大数据的商业潜力只受到企业用户创造性思维的限制。本书的重点即,帮助未来的商业领
本书系统地介绍了数据挖掘的方法和技术,主要内容包括:决策树挖掘;关联规则挖掘;逻辑回归;神经网络;聚类分析;支持向量机;降维;异常检测等。每一章都会涉及学习要点、学习难点和思考题,希望能使学生对数据挖掘的整体结构、理论、概念、技术和方法有深入的认识和了解;掌握数据挖掘的技术、方法及数据挖掘应用系统开发,了解数据仓库和数据挖掘技术的研究问题、现状及未来的研究方向。并且结合具体案例的分析,实现数据挖掘的功能。希望学生在创新意识、科研能力等
这是一本没有编程基础也能学习的企业数据分析书。本书以解决企业中常见的数据分析问题为主线,通过实例,采用“思路―方法―具体实现过程”的结构进行通俗易懂的讲解。本书共分为3 篇。 篇,带领读者了解数据分析并熟悉3 个很常用的数据分析工具――SPSS Modeler、Power BI 和MySQL。也许你之前都没有听说过SPSS Modeler 和Power BI,但请不要担心,它们真的很容易上手。第2 篇商品分析,介绍了企业中两个典型的分
《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。 《数据挖掘与预测分析(第2版)》的新内容: 添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本.效益分析、缺失数据填补、聚类优劣度量以及细分模型等。 针
本书集结了作者近年来在大数据及其应用领域的研究成果, 针对大数据高效处理问题, 从点排序识别聚类、多标签排序、不平衡数据采样、主动学习、增量学习等方面研究并设计了相关算法。在此基础上, 对大数据环境下电信客户价值评价、客户换机预测和客户流失预测等问题, 设计了相关算法、流程和仿真实验, 并提出了一些合理化的建议, 为大数据分析与在相关行业的应用提供了参考...
梁实秋
阎连科
刘争争
汪曾祺
泰戈尔
[日]熊田千佳慕著,张勇译
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071