小说 青春文学 中国散文 外国散文 悬疑推理 文学理论 文集 世界名著
外国小说| 中国当代小说| 中国古典小说| 中国近现代小说| 悬疑推理| 科幻小说 世界名著 四大名著| 作品集| 更多
外国诗歌| 中国古诗词| 中国现当代诗歌| 外国散文| 中国现当代散文| 中国古代散文 文学理论| 文集| 戏剧| 更多
玄幻/科幻| 悬疑/惊悚| 叛逆/成长| 爆笑/无厘头| 校园| 港台青春文学| 外国青春文学 更多
历史 哲学/宗教 社会科学 政治军事 传记 文化 古籍 管理 经济 成功励志 法律 语言文字
中国史| 世界史| 地方史志| 历史知识读物| 史料典籍| 史学理论| 考古文物 民族史志
政治| 军事| 中国政治| 国际政治| 外交/国际关系 哲学| 宗教| 美学 哲学知识读物| 中国古代哲学
历代帝王| 历史人物| 科学家| 体育明星| 文学家| 学者| 艺术家| 文娱明星 政治人物| 自传| 更多
世界文化| 中国文化| 中国民俗| 地域文化| 文化理论| 文化评述| 神秘现象
心理学| 人类学| 教育| 社会学| 新闻传播出版| 语言文字| 更多
古籍整理| 经部| 史类| 子部| 集部
经济理论| 中国经济| 国际经济| 经济通俗读物| 保险| 会计| 金融投资 市场营销| 管理学| 电子商务
成功激励| 口才演讲| 名人励志| 人际交往| 人生哲学| 心灵修养| 性格习惯 更多
法的理论| 法律法规| 国际法| 经济法| 更多
中国儿童文学 外国儿童文学 科普读物 绘本 动漫/卡通 幼儿启蒙
中国儿童文学| 外国儿童文学| 童话| 小说| 寓言传说|
动漫/卡通
科普| 百科| 历史读物| 生活常识| 益智游戏| 传统文化
幼儿启蒙| 少儿英语| 励志/成长| 艺术课堂
0-2岁| 3-6岁| 7岁及以上
绘画 书法篆刻 艺术理论 摄影 音乐
绘画理论| 国画| 油画| 素描速写| 水粉水彩
碑帖| 技法教程| 书法理论| 硬笔书法| 字帖| 篆刻
设计| 摄影后期| 摄影教程| 摄影理论| 摄影器材| 数码摄影| 作品集
影视理论| 影视赏析| 影视制作| 舞台/戏曲艺术
钢琴| 吉它| 理论/欣赏| 声乐| 通俗音乐| 外国音乐| 中国民族音乐| 作曲/指挥
宝石| 雕品| 古代家具| 钱币| 收藏百科| 收藏随笔| 书画| 陶瓷| 玉器
艺术理论| 雕塑| 工艺美术| 建筑艺术| 民间艺术| 人体艺术| 艺术类考试
美食 保健/心理健康 旅游 家庭教育 家居休闲
饮食文化| 保健食谱| 家常食谱| 八大菜系| 餐饮指南| 世界美食| 更多
健康百科| 健身| 心理健康| 中老年| 中医保健 常见病| 更多
旅游随笔| 旅游攻略| 旅游画册| 城市自助游| 国内自助游| 国外自助游| 地图地理 更多
孕产百科| 育儿百科| 更多
美丽妆扮| 两性关系| 家居休闲| 个人理财
中小学教辅 外语 教材 医学 计算机 自然科学
语文阅读| 拓展读物| 高考| 初中通用| 高中通用| 工具书 教师用书| 更多
英语读物| 职业英语| 英语考试| 大学英语| 少儿英语 更多
研究生/本科/专科教材 | 职业技术培训| 中小学教材|
操作系统/系统开发| 数据库| 信息安全 程序设计| 电脑杂志| 计算机教材| 计算机考试认证 计算机理论| 计算机体系结构| 家庭与办公室用书| 企业软件开发与实施| 人工智能 软件工程/开发项目管理|
考试| 家庭教育| 自然科学| 科普读物| 医学| 农林业| 工业技术| 建筑
笔记本 布艺品 书签/藏书票
笔记本| 布艺品| 书签/藏书票| 明信片| 笺纸| 胶带| 其它
本书着重介绍了偏最小二乘、支持向量机、时间序列、数据包络法以及层次分析法的理论知识,并在此基础上分别进行了偏最小二乘通径模型在宁波与国内试点海绵城市水资源利用率比较、偏最小二乘通径模型的公共文化服务满意度测评与实证研究—以宁波市为例、偏最小二乘通径模型的新建本科院校学生自主学习能力实证研究、数据包络分析法的高校实验室投入产出效率评价及优化路径—以宁波大红鹰学院为例研究报告、支持向量机方法在宁波海洋生态环境安全预测研究、预测模型在宁波港
《数据准备和特征工程――数据工程师必知必会技能》详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。 《数据准备和特征工程――数据工程师必知必会技能》既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人
facebook、twitter和linkedin产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 本书每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所
本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。 本书适合作为相关专业高年级本科生和研究生数据挖掘课程的教材,同时
空间数据挖掘是一个从海量数据中概括知识的不确定过程,不同用户在不同条件下有着不同的挖掘要求。本书提出空间数据挖掘视角,描述不同的数据挖掘需求,实现从相同数据向多种知识的变粒度挖掘。空间数据挖掘不确定性的内因和外因,决定了在空间数据挖掘视角中管控不确定性的技术。云模型集成模糊性和随机性,数据场刻画数据的自然拓扑关系,能够实现定性定量的相互转换。滑坡监测数据挖掘视角和网络化数据挖掘视角表明,空间数据挖掘视角发现的多粒度知识可以满足不同用户
本书共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入nosql数据库;系统篇主要介绍了各种类型nosql数据库基本知识;应用篇对国内外知名公司在利用nosql数据库在处理海量数据方面的应用做了阐述。本书对大数据时代面临的挑战,以及nosql
本书是站在数据挖掘的独特角度对神经网络、支持向量机和隐马尔可夫理论这三个重要的理论与方法进行重新剖析,并进行方法论基础上的应用,通过讲故事似的生动而系统地阐述数据挖掘的本质,来引领读者对数据挖掘的深入理解和应用...
本书涵盖了作战仿真数据规划、数据建模、数据集成、元数据集拟制、数据分析与数据挖掘、数据可视化、数据管理等方面的实验项目,实验内容饱满、步骤详细,有助于提高学生的实验效果。每个实验的内容包括实验目的、实验内容和要求、实验环境、实验报告。除此之外,实验一数据资源规划还包括了关于IRP2000工具的简介、学生学习生活情况的调查与分析、学生信息管理系统数据规划步骤等内容;实验二数据建模还包括了PowerDesigner工具的简介,学生学习生活
新增了大量实战案例的分析和讲解,并精选书中的部分案例由作者制作成视频教学资料(DVD光盘)随书附赠。...
破除大数据神话 带领我们从云端回到地面 著名传播学者文森特莫斯可关于大数据的批判性力作...
本书从大数据发展现状出发, 在人类DIKW知识层次中认识“数据”, 阐述大数据时代以数据为中心的必然性, 进而提出数据管理的新范式, 即以系统科学及开放复杂巨系统为主要特征的范式, 并论述数据管理正在向新范式转换 ; 为解决数据系统中众多管理问题, 从数据语义出发给出数据分布模型概念, 并论述其是大数据时代数据管理的核心与基础 ; 定义了一种数据分布模型 —— MHM...
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。本书结合企业推荐的“用户行为分析系统”,让读者能够快速上手的同时,也不乏
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中,Linux是学习大数据技术的基础,先从Linux入手,打下坚实的基础,之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。 大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作,为以后编程奠定坚实的基础。 Hadoop技术篇以Hadoop生态圈为中心,详细介绍Hadoop高可用集
本书主要以OpenTSDB的很新版本(2.3.1版本)为基础进行介绍。章从OpenTSDB的入门开始,介绍市面上多种时序数据库和云端时序数据库,OpenTSDB的基础概念、源码环境搭建及Grafana的基本使用等。第2章主要介绍OpenTSDB的网络层,涉及Java NIO基础、Netty基本使用,分析了OpenTSDB网络层的架构和实现。第3章介绍OpenTSDB中UniqueId组件的原理,主要讲解如何实现UID与字符串之间的映射
随着计算机和互联网技术的飞速发展和广泛普及, 互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后, 需要通过数据预处理和数据分析来获取数据的价值, 从而造福人类, 推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南, 内容包括三部分: 基础知识、基于Python的大数据预处理、基于Python的大数据分析...
本文主要包含七部分内容,分别为引言、时序数据约简建模与应用、新型距离测度模型与电力价格突变预测、云特征挖掘模型与电价预测、容差粗集模型与客户信用度分析、电力企业决策支持应用平台实例及结论与展望...
本书从实战出发,介绍微服务架构所带来的测试方面的挑战,以及如何利用新的技术来应对这些挑战。通过本书,读者可以学会如何编写微服务架构下的单元测试、组件测试、集成测试以及契约测试。在此过程中还会用到Arquillian、ShrinkWrap、Pact、Selenium、Docker、Hoverfly 等多个帮助测试的工具和框架。书中涵盖大量的代码和样例,可以帮助读者快速上手,并在自己的实际工作中应用这些技术。本书适合有一定Java 基础的
本书全面阐述了全球最新的安全理论与安全架构体系, 并结合作者自身经验层层剖析了包括Google在内的各大互联网企业所应用的各种关键安全技术的原理以及具体实现。全书共分为3篇15章。上篇“安全理论体系”主要讲解了业界先进的安全架构体系 (IPDRR模型、集成式自适应网络防御、网络韧性架构) 与安全建设理念 (ISMS管理体系、BSIMM工程体系、Google技术体系) 。中篇“基础安全运营平台”主要内容有: 威胁情报、漏洞检测、入侵感知
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本的问题, 包括什么是数据, 什么是大数据, 什么是数据挖掘, 以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用六章的篇幅, 介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘六种方法。第8章介绍一些实际的应用, 演示简单的数据挖掘方法如何产生巨大的价值...
Python 是一种面向对象的脚本语言,其代码简洁优美,类库丰富,开发效率也很高,得到越来越多开发者的喜爱,广泛应用于Web 开发、网络编程、爬虫开发、自动化运维、云计算、人工智能、科学计算等领域。预测技术在当今智能分析及其应用领域中发挥着重要作用,也是大数据时代的核心价值所在。随着AI 技术的进一步深化,预测技术将更好地支撑复杂场景下的预测需求,其商业价值不言而喻。基于Python 来做预测,不仅能够在业务上快速落地,还让代码维护更
本书结合数据科学与大数据技术专业 (本科) 和大数据技术与应用专业 (专科) 的教学需要以及大数据分析爱好者的自学需要, 从大数据和数据科学视角讲解Python编程的基础知识和基本技能, 内容包括: 数据科学实践和大数据分析中常用的知识点, 数据科学实践和大数据分析中常用的编程技巧等...
本书从Power BI的基础功能讲起,逐步深入到Power BI进阶实战,以业务案例为导向,以Power BI桌面版操作为基础进行讲解,深入讲述Power BI在各个业务部门的应用。本书包括7篇共21章内容,分业务场景进行讲解。篇用1章内容讲述Power BI基础操作,方便读者快速入门;第2篇用4章内容讲述如何用Power BI爬取天气、电影、销售、股票等数据;第3篇用4章内容讲述销售部门如何用Power BI分解销售目标,分析业绩达
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。很后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品...
本书使用大量的matplotlib实用案例讲解Python数据可视化在各个应用方向上的实现方法。通过学习这些实用案例,读者可以更好地掌握Python数据可视化的不错技能。本书主要由图形、元素、交互、探索和拓展5部分组成,每部分的实用案例都有利于拓展matplotlib的应用视野,而且案例中的示例代码只涉及Python的基础知识。这样,在Python数据可视化的实践中,有利于读者将时间和精力放在系统掌握matplotlib知识和技能上面
作为《谁说菜鸟不会数据分析》家族的新成员,本书依然通俗地讲解数据分析的实践。《谁说菜鸟不会数据分析(SPSS篇)》继续采用职场三人行的方式来构建内容,细致梳理了准专业数据分析的常见问题,并且挑选出企业实践中容易碰到的案例,以轻松直白的方式来讲好数据分析的故事。从解决工作中的实际问题出发,从统计描述、统计推断到探索性分析,总结并提炼工作中经常用到并且很好实用的通过SPSS 进行数据处理、数据分析实战方法与技巧。尽可能避免使用晦涩难懂的统
社会网络是当前学术和产业界的研究热点。然而,现阶段大多数的研究都集中于单一的社会网络内部。社会网络融合为社会计算等各项研究提供更充分的用户行为数据和更完整的网络结构,从而更有利于人们通过社会网络理解和挖掘人类社会,具有重要的理论价值和实践意义。准确、全面、快速的关联用户挖掘是大型社会网络融合的根本问题。社会网络中的关联用户挖掘旨在通过挖掘不同社会网络中同属于同一自然人的不同账号,从而实现社会网络的深度融合,近年来已引起人们的广泛关注。
随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 该书汇集了到目前为止全面的维度建模技术。 该书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的
本书是一本从入门到精通模式的Selenium WebDriver实战经验分享书籍。全书共分为四个部分:部分为基础篇,主要讲解与自动化测试相关的基础理论、WebDriver环境安装、单元测试工具的使用方法及 WebDrvier的入门使用实例;第二部分为实战应用篇,基于丰富的实战案例讲解页面元素的定位方法及WebDriver的很常用API使用方法;第三部分为自动化测试框架搭建篇,深入讲解了页面对象的设计模式,以及分布式并发执行测试框架、数
本书系统地介绍数据搜索与实时分析引擎套件Elastic Stack的相关技术,并通过实战讲解的方式介绍Elasticsearch、Logstash、Kibana、XPack、Beats等的应用。全书共11章,内容涵盖Elasticsearch架构简介、文档索引及管理、信息检索与聚合、Elasticsearch API及其应用、Elasticsearch配置与集群管理、基于Logstash的日志处理、基于Kibana的数据分析及可视化
内容简介:本书共有8章,面向的对象是Excel初学者,从Excel的基本理念开始,用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化,这是极其重要的,任何一个Excel小白都不能跨过这一步!即使已经有了所谓Excel基础的人,很后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍,以及如何利用这些工具技能来解决实际问题...
这是一本 Power BI 的入门指南,涵盖了该工具的基础知识,同时展示了Power BI的主要功能。本书主要包含8章内容,分别为Power BI简介、分享仪表板、理解数据刷新、使用Power BI Desktop、从服务和内容包中获取数据、建立数据模型、改进 Power BI 报告、在公司中应用 Power BI。本书作者拥有多年的教学经验,通过一个打造预算系统的案例,从如何注册账户、导入数据、建立模型、图表动态呈现、报表发布、数据
本书共有8章, 面向的对象是Excel初学者, 从Excel的基本理念开始, 用3章的篇幅介绍Excel的基本规则和基础表单的标准化和规范化, 这是极其重要的, 任何一个Excel小白都不能跨过这一步! 即使已经有了所谓Excel基础的人, 最后还是要从头来重新打基础。然后是Excel常用工具、函数和透视表的基本应用的介绍, 以及如何利用这些工具技能来解决实际问题...
全书共有15章,分为4篇。基础篇,阐述数据可视化的基础理论和概念,从人的感知和认知出发,介绍数据模型和可视化基础;时空数据篇,介绍带有空间坐标或时间信息的数据的可视化方法,此类数据通过设备在真实物理空间中采集得到或由科学计算模拟产生;非时空数据篇,描述非结构化和非几何的抽象数据的可视化,这些数据既存在于真实物理空间,又是社会空间和网络信息空间的基本表达形式;用户篇,介绍面向各类数据的可视化在实际应用同需要的方法、技术和工具,例如交互和
本书介绍了当下很流行的实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理FLinkCEP,以及指标度量与部署模式。此外,本书展开分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联关系;深入分析了多项式曲线拟合、分类算法SVM、推荐算法ALS-WR的理论和FlinkML实现。希望快速上手Flink以开展实时大数据处理与在线机器学习应用的从业者,本书是不
内容简介这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。全书一共8章:-3章
本书介绍了互联网环境下文本类型数据的分析方法,探讨了当前主流的文本挖掘技术,以及这些技术在商业环境中的具体应用。本书从算法原理和应用场景两方面分别对在线文本分析技术进行了介绍:从算法原理的角度,以数据挖掘和机器学习的相关知识为基础,介绍了以文本建模、文本分类、文本聚类、序列标注为主要任务的文本分析方法,并对当前主流的深度学习方法与文本分析的结合进行了讨论。从应用场景的角度,讨论了文本分析技术的几个重要实践领域,包括信息检索、内容摘要、
《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》源自网易公司多位资深数据库专家数年的经验总结和MySQL数据库的使用心得,在之前版本的基础之上,基于MySQL 5.7版本进行了内容升级,同时也对MySQL 8.0的重要功能进行了介绍。除了对原有内容的更新之外,本书还新增了作者在高可用架构、数据库自动化运维,以及数据库中间件方面的实践和积累。 《深入浅出MySQL:数据库开发、优化与管理维护(第3版)》分为“基础篇”“开发篇
本书从教育大数据的重要意义、国内外教育大数据的研究现状以及政策支持出发, 对教育大数据的相关概念和内涵做阐述说明, 介绍了教育大数据的技术、技术标准、治理与开放、风险管理与法律政策, 重点阐述了教育大数据在教育领域的典型应用, 包括教育大数据在课堂教育、校园管理、在线教育、开放远程教育、教育培训行业以及学生综合素质评价等方面的应用, 最后提出教育大数据的发展趋势和机遇挑战...
本书系统介绍了数据结构相关理论和基本算法,讨论了线性表、堆栈、队列、树和图等数据结构的基本概念、逻辑结构、存储结构,以及在这些结构基础上所实施的各种操作...
《商业智能工具应用及数据可视化》一书聚焦商业智能与数据可视化主题,从概念、价值、方法、工具等理论基础出发,以实际场景为参考,分入门、进阶两大阶段,以帆软FineBI为例从商业智能工具的基本知识,商业应用场景,数据可视化很好案例等方面,介绍了商业智能工具和各种常规和不错可视化图形的使用方法,重点介绍了商业智能工具FineBI的数据分析与可视化应用实践。本书内容层层递进,体系完善,可使读者对商业智能工具的运用有一个全面、系统、深入的了解.
本书是一本利用Python技术,结合人工智能、神经网络和机器学习、遗传算法等互联网技术进行相应行业模型开发的技术图书。本书~4 章主要讲解了利用Python软件分析模型开发的入门知识,包括开发工具的使用、测试技术难点等内容;第5~7 章主要讲解了利用人工智能中的神经网络技术进行技术研发,利用数据挖掘技术完善行业技术模型的数据加载与分析等内容;第8~9 章主要讲解了利用大数据进行技术配置和风险控制等内容;0~11 章主要讲解了利用机器学
面对小数据和大数据,数据分析师应该如何收集数据信息?传统的业务框架如何与统计学相关联?测量学扮演着什么角色?建模过程有哪些预分析技术和修正技术?建模工作完成后,如何解析?如何归因?如何预测?等等,这些数据分析能力构成了本书的分析框架。本书分为8章,小数据与大数据分析模式的动态切换贯穿全书,展示了数据分析案例的模块化分析思路。~3章为数据预分析部分,强调业务问题与统计问题的衔接;第4~6章为统计建模阶段,其中附有对行业案例和业务敏感度的
本书全面介绍了文本情感分析领域的主要研究问题,包括情感词典自动构建,主客观分类,篇章、句子、属性等不同层级的情感分类,跨领域情感分类,跨语言情感分类,情绪分析理论和情绪分类,以及结合情感的文本摘要与观点检索研究等。同时,还对情感分析与观点挖掘研究领域的公开资源进行了整理与归纳。本书重在对情感分析和观点挖掘研究的主流方法和前沿进展进行概括、比较和分析,适用于该领域高校科研院所的研究参考,也可以作为企业和政府对该领域的实际应用的指导...
本书名《数典》,定义为大数据标准术语体系,是迄今为止优选首部全面系统研究大数据标准术语的多语种专业工具书。该书以优选语境和未来视角,对大数据知识体系进行了全面梳理,提出了九个方面的术语架构,并以十一种语言对照编纂,形成了统一规范、符合靠前通用规则的多语种学术话语体系和术语标准体系...
近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。部分 大数据处理框架的基础知识(~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分 S
高价值、低密度是大数据的特征,挖掘高价值、低密度的数据对象是大数据的一项重要工作。特异群组是一类高价值、低密度的数据形态,是指在众多行为对象中,少数对象群体具有一定数量的相同(或相似)的行为模式,表现出相异于大多数对象而形成的异常的群组。特异群组挖掘在证券金融、医疗保险、智能交通、社会网络和生命科学研究等领域具有重要的应用价值。对特异群组挖掘的研究代表了数据挖掘从浅层到深层的发展趋势和必要性。 本书系统地阐述了特异群组挖掘任务,包括介
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难
这是一本没有编程基础也能学习的企业数据分析书。本书以解决企业中常见的数据分析问题为主线,通过实例,采用“思路―方法―具体实现过程”的结构进行通俗易懂的讲解。本书共分为3 篇。 篇,带领读者了解数据分析并熟悉3 个很常用的数据分析工具――SPSS Modeler、Power BI 和MySQL。也许你之前都没有听说过SPSS Modeler 和Power BI,但请不要担心,它们真的很容易上手。第2 篇商品分析,介绍了企业中两个典型的分
本书结合大量实例,系统讲解了电商经营中涉及的各种数据及其分析方法,能让读者快速学会如何做电商数据分析,并能利用数据分析结果指导网店经营。 本书共8 章,内容包括电商数据分析的基础知识、行业数据分析、产品数据分析、店铺数据化运营、客户数据分析、竞争对手数据分析、库存数据分析、财务数据分析。 本书内容全面、案例丰富,具有很强的可读性和实用性,不仅适合从事电商相关工作的读者阅读,还适合作为高等学校相关专业和培训机构的教材...
全书理论联系实际,全面讲述数据挖据理论、技术及应用的教材。研讨了数据挖掘的方方面面,从基础理论到复杂数据类型及其应用。不仅讨论传统的数据挖掘问题,而且介绍了不错数据类型,例如文本、时间序列、离散序列、空间数据、图数据和社会网络。本书由基础篇和进阶篇组成。基础篇对应原书的~11章,进阶篇对应原书的2~20章...
本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基
刘争争
(美)艾玛·克莱因(EmmaCline
梁实秋
[英]蕾秋·乔伊斯 著,焦晓菊 译
汪曾祺
[日]熊田千佳慕著,张勇译
京ICP备09013606号-3京信市监发[2002]122号海淀公安分局备案编号:1101083394
营业执照出版物经营许可证 京出发京批字第直110071